Báo cáo nghiên cứu: Ứng dụng nhận diện hình ảnh OBJECT DETECTION

Báo cáo nghiên cứu: Ứng dụng nhận diện hình ảnh OBJECT DETECTION

TRƯỜNG ĐẠI HỌC PHÚ YÊN
KHOA KỸ THUẬT – CÔNG NGHỆ
Sinh viên chịu trách nhiệm:
NGUYỄN MINH THỊNH
Lớp: ĐH CNTT C19
ỨNG DỤNG NHẬN DIỆN HÌNH ẢNH OBJECT
DETECTION ĐỀ PHÂN TÍCH MÓN ĂN THÀNH
CÔNG THỨC CHẾ BIẾN
Sinh viên tham gia nghiên cứu: NGUYỄN MINH THỊNH
Lớp: ĐH CNTT C19
Giảng viên hướng dẫn: TS Thị Hồng Loan
Phú Yên, 2022
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
MỞ ĐẦU
Lý do chọn đề tài
Trong thời đại hiện nay, việc giới trẻ sử dụng mạng hội như Facebook,
Instagram, Twitter ngày càng được mở rộng, ở đó, các bạn trẻ có thể thỏa sức đăng
những hình ảnh về cuộc sống thường ngày, những hình ảnh vui chơi, giải trí,
những khoảnh khắc trong cuộc sống, trong đó việc đăng tải những hình ảnh
món ăn. Đôi lúc, sẽ nhiều người sẽ để ý hứng thú, tuy nhiên họ không thể
biết được toàn bộ những nguyên liệu, cách nấu món ăn đó như thế nào. vậy,
việc ứng dụng nhận diện hình ảnh Object Detection sẽ thể giúp phân tích hình
ảnh món ăn thành công thức chế biến, thể giúp được các nhân hứng thú
với món ăn đó họ không biết được cách thức chế biến, nguyên liệu của món ăn
đó [1].
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
Tổng quan tình hình nghiên cứu
Object Detection đề cập đến năng lực của mạng lưới hệ thống máy tính
ứng dụng để xác định những đối tượng người dùng trong một hình ảnh xác lập
từng đối tượng người dùng. Object Detection đã được sử dụng thoáng đãng để phát
hiện khuôn mặt, phát hiện xe, đếm số người đi bộ, mạng lưới hệ thống bảo mật
thông tin xe không người lái. nhiều cách để nhận diện đối tượng người tiêu
dùng hoàn toàn thể được sử dụng cũng như trong nhiều nghành nghề dịch vụ
thực hành thực tế. Giống như mọi công nghệ tiên tiến khác, một loạt những ứng
dụng phát minh sáng tạo tuyệt vời của Object Detection sẽ đến từ những lập
trình viên và những nhà tăng trưởng ứng dụng [2].
Bắt đầu sử dụng những giải pháp nhận diện đối tượng người dùng văn minh
trong những ứng dụng mạng lưới hệ thống, cũng như thiết kế xây dựng những
ứng dụng mới dựa trên những giải pháp này. Việc triển nhận diện đối tượng người
tiêu dùng sớm tương quan đến việc sử dụng những thuật toán cổ xưa, giống như
những thuật toán được tương hỗ trong OpenCV, thư viện computer vision thông
dụng. Tuy nhiên, những thuật toán cổ xưa này không hề đạt được hiệu suất đủ để
thao tác trong những điều kiện kèm theo khác nhau [3].
Điều gì giúp mở rộng công nghệ nhận diện hình ảnh ngày nay? Đó là các công cụ
mã nguồn mở giúp lập trình dễ dàng hơn. Trong khi đó giá cả thì ngày càng rẻ hơn.
Các khung công tác và thư viện nguồn mở giúp các công ty có thể hưởng lợi từ
công nghệ nhận diện hình ảnh theo cấp số nhân[4].
Hiện nay có rất nhiều định nghĩa về công nghệ nhận dạng hình ảnh. Nhận dạng
hình ảnh hay được biết đến với tên gọi khác là tầm nhìn máy tính. Đây là một
trong những kỹ thuật dùng để tìm kiếm các cách tự động hóa tất cả công việc mà
một hệ thống thị giác của con người có thể làm .
Ưu điểm lớn nhất của các dịch vụ mã nguồn mở nhận diện hình ảnh hiện nay là vô
kể. Ngoài việc tiến hành tính toán giúp nhận dạng hình ảnh trên đám mây, giúp cho
hoạt động kinh doanh trở nên hiệu quả hơn và rẻ hơn rất nhiều.Các API còn có thể
được tích hợp vào nội bộ công ty mà không gặp những trục trặc về bản quyền hay
sự cố. Thậm chí, các nhà phát triển API mở này có thể sử dụng để phát triển một
doanh nghiệp mới trong lĩnh vực nhận dạng hình ảnh.
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
Mục tiêu nghiên cứu
- - Tìm ra được các thành phần nguyên liệu của món ăn thông qua hình ảnh.
- - Tìm các công thức, cách nấu, chi tiết về các nguyên liệu.
Đối tượng và phạm vi nghiên cứu
1. Đối tượng nghiên cứu
- Công thức chế biến của một món ăn
2. Phạm vi nghiên cứu
- Các món ăn chính của người miền Trung
Phương pháp nghiên cứu
- Thực nghiệm: Khảo sát, ăn thử các món ăn chính trong bữa ăn của người
miền Trung
- Nghiên cứu tài liệu: Tìm hiểu các món ăn chính của khu vực miền Trung
thường nấu
Nội dung nghiên cứu
CHƯƠNG 1: NHẬN DIỆN HÌNH ẢNHKỸ THUẬT NHẬN DIỆN HÌNH
ẢNH OBJECT DETECTION
1.1 Nhận diện hình ảnh
1.2 Kỹ thuật nhận diện hình ảnh Object Detection
CHƯƠNG 2: PHÂN TÍCH DỮ LIỆU HÌNH ẢNH MÓN ĂN THÀNH CÔNG
THỨC CHẾ BIẾN
2.1 Mô tả hoạt động
2.2 Dữ liệu về hình ảnh món ăn
2.3 Cách thức phân tích
CHƯƠNG 3: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
3.1 Kết luận
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
3.2 Hướng phát triển
CHƯƠNG 1: NHẬN DIỆN HÌNH ẢNHKỸ THUẬT NHẬN DIỆN HÌNH
ẢNH OBJECT DETECTION
1.1 Nhận diện hình ảnh:
- Nhận diện hình ảnh hoặc thị giác máy tính một kỹ thuật tìm kiếm các cách để
tự động hóa tất cả công việc mà một hệ thống thị giác của con người có thể làm.
- Những cái tên như TensorFlow của Google, DeepFace của Facebook, Dự án
Oxford của Microsoft. Chúng đều những dụ tuyệt vời về hệ thống nhận diện
hình ảnh. Mặt khác, các API được lưu trữ cho phép các doanh nghiệp tiết kiệm một
số tiền lớn cho các nhóm phát triển. dụ như Google Cloud Vision, Clarifai,
Imagga…[5].
- Hình ảnh có thể được sử dụng theo những cách khác nhau.Trong các hình ảnh
phát triển phần mềm di động, web và phần mềm phục vụ cho vô số lý do, bao gồm:
Nhận diện đối tượng
Nhận diện mẫu
Định vị các bản sao (chính xác hoặc một phần)
Tìm kiếm hình ảnh theo phân đoạn
Xử lý ảnh (retouch,...)
Cải thiện ứng dụng di động UX
- Tính ứng dụng của chúng là không giới hạn. Những tiến bộ trong công nghệ mở
ra nhiều cơ hội mới cho các doanh nghiệp. Do đó, phân tích hình ảnh được đưa đến
một cấp độ hoàn toàn mới. Điều này nhờ vào các giải pháp nguồn mở và các công
cụ học sâu (deep learning).
- Ưu điểm của các dịch vụ mã nguồn mở được đề cập rất nhiều. Các tính toán nhận
diện hình ảnh trong đám mây có một ưu điểm lớn. Đó là nó khiến hoạt động kinh
doanh trở nên hiệu quả và rẻ hơn rất nhiều. Ngoài ra, các nhà phát triển nội bộ của
doanh nghiệp có thể tích hợp API của họ vào ứng dụng mà không gặp sự cố.
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
1.2 Kỹ thuật nhận diện hình ảnh Object Detection:
- Một trong những lĩnh vực quan trọng của Trí tuệ nhân tạo (Artificial Intelligence)
là thị giác máy (Computer Vision). Computer Vision là một lĩnh vực bao gồm các
phương pháp thu nhận, xử lý ảnh kỹ thuật số, phân tích và nhận dạng các hình ảnh,
phát hiện các đối tượng, tạo ảnh, siêu phân giải hình ảnh và nhiều hơn vậy. Object
Detection có lẽ là khía cạnh sâu sắc nhất của thị giác máy do số lần sử dụng trong
thực tế.
- Object Detection đề cập đến khả năng của hệ thống máy tính và phần mềm để
định vị các đối tượng trong một hình ảnh và xác định từng đối tượng. Object
Detection đã được sử dụng rộng rãi để phát hiện khuôn mặt, phát hiện xe, đếm số
người đi bộ, hệ thống bảo mật và xe không người lái. Có nhiều cách để nhận diện
đối tượng có thể được sử dụng cũng như trong nhiều lĩnh vực thực hành. Giống
như mọi công nghệ khác, một loạt các ứng dụng sáng tạo và tuyệt vời của Object
Detection sẽ đến từ các lập trình viên và các nhà phát triển phần mềm [6].
- Bắt đầu sử dụng các phương pháp nhận diện đối tượng hiện đại trong các ứng
dụng và hệ thống, cũng như xây dựng các ứng dụng mới dựa trên các phương pháp
này.Việc triển nhận diện đối tượng sớm liên quan đến việc sử dụng các thuật toán
cổ điển, giống như các thuật toán được hỗ trợ trong OpenCV, thư viện computer
vision phổ biến. Tuy nhiên, các thuật toán cổ điển này không thể đạt được hiệu suất
đủ để làm việc trong các điều kiện khác nhau.
- Các mô hình phát hiện đối tượng thường được đào tạo để phát hiện sự hiện diện
của các đối tượng cụ thể trong hình ảnh, video hoặc hoạt động thời gian thực (real
time). Ngay cả trước khi có phương pháp học sâu và công nghệ xử lý hình ảnh hiện
đại, việc phát hiện đối tượng vẫn được quan tâm rất nhiều. Khi đó người ta thường
ứng dụng một số phương pháp xử lý ảnh như SIFT và HOG với kỹ thuật trích xuất
cạnh của vật thể[7].
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
Object Detection
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
CHƯƠNG 2: PHÂN TÍCH DỮ LIỆU HÌNH ẢNH MÓN ĂN THÀNH CÔNG
THỨC CHẾ BIẾN
2.1 Mô tả hoạt động:
Khi quét hình ảnh món ăn, hệ thống nhận diện hình ảnh sẽ bắt đầu hoạt động
để phân tích hình ảnh món ăn đó bao gồm: màu sắc, cách trình bày, hình ảnh món
ăn đó có ở các nền tảng khác hay không, các nguyên liệu, từ đó sẽ cho ra kết quả là
công thức của món ăn, nguyên liệu, cách chế biến.
2.2 Dữ liệu về hình ảnh món ăn:
- Dữ liệu về hình ảnh món ăn bao gồm các món được đăng tải trên các mạng
xã hội như Facebook, Instagram, các nền tảng Internet.
- Ngoài ra thể quét dữ liệu về các món ăn đời thực, các món chính
miền Trung, các hình ảnh có sẵn trong các thiết bị như điện thoại, máy tính.
2.3 Cách thức hoạt động:
- Phân loại hình ảnh: Dự đoán nhãn của một đối tượng trong một hình ảnh.
+ Input: Một hình ảnh là ảnh của một món ăn chính của miền Trung
+ Output: Nhãn lớp của các thành phần món ăn đ
- Định vị đối tượng: Xác định vị trí hiện diện của các đối tượng trong ảnh
cho biết vị trí của chúng bằng bounding box.
+ Input : Hình ảnh một hoặc nhiều đối tượng, dụ như món cơm
chiên sẽ có các đối tượng như cơm, trứng, ...
+ Output: Một hoặc nhiều bounding box được xác định bởi tọa độ
tâm, chiều rộng và chiều cao.
- Phát hiện đối tượng: Xác định vị trí hiện diện của các đối tượng trong
bounding box và nhãn của các đối tượng nằm trong một hình ảnh.
+ Input: Hình ảnh món ăn chính của miền Trung
+ Output: Một hoặc nhiều bounding box nhãn cho mỗi
bounding box, các bounding box sẽ bao phần thức ăn đó đưa ra
nhãn là tên của loại nguyên liệu[8].
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
CHƯƠNG 3: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
3.1 Kết luận
Nhận diện món ăn thành công thức chế biến bằng kỹ thuật object detection
là một dự án có thể thực hiện được, nó có thể giải quyết đơn giản việc mộtnhân
hứng thú với món ăn nhưng không thể tìm được công thức cũng như nguyên
liệu đầy đủ của món ăn đó
3.2 Hướng phát triển:
Nhận diện món ăn thành công thức chế biến bằng kỹ thuật object detection
sẽ được phát triển hơn nữa để ngoài việc phân tích các món ăn chính của người
miền Trung thì còn thể phân tích nhiều hơn các món như món phụ, món ăn
sáng, món ăn vặt, ....
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
TÀI LIỆU THAM KHẢO
[1] “Trí tuệ nhân tạo biến hình ảnh món ăn thành công thức chế biến”, Báo
Nghệ An điện tử - Tin tức cập nhật trong ngày, 11 Tháng Mười 2018.
[2] “[Computer Vision] Object Detection (nhận diện vật thể) chỉ với 10 dòng
code sử dụng ImageAI”, Viblo, 15 Tháng Bảy 2018.
[3] “Deep learning: Nhận diện vật thể qua ảnh chụp”.
[4] “Giới thiệu một số thuật toán phát hiện đối tượng phổ biến”, VinBigData, 21
Tháng Ba 2022.
[5] “Phân biệt một số bài toán trong lĩnh vực Computer Vision – AI CLUB
TUTORIALS”.
[6] Băng T., “Thu Thập Dữ Liệu Cho Deep Learning && Giới Thiệu Về
Imagenet”, 19 Tháng Ba 2020.
[7] T. Blog, “Thuật toán CNN - Convolutional Neural Network”, TopDev, 8
Tháng Tám 2019.
[8] “Tracking/theo vết đối tượng trong ảnh - Chương 1”, Mì AI, 6 Tháng Giêng
2020.
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
Downloaded by Van Le (mrl3v4n@gmail.com)
lOMoARcPSD|25518217
| 1/11

Preview text:

lOMoARcPSD|25518217
TRƯỜNG ĐẠI HỌC PHÚ YÊN
KHOA KỸ THUẬT – CÔNG NGHỆ
Sinh viên chịu trách nhiệm: NGUYỄN MINH THỊNH Lớp: ĐH CNTT C19
ỨNG DỤNG NHẬN DIỆN HÌNH ẢNH OBJECT
DETECTION ĐỀ PHÂN TÍCH MÓN ĂN THÀNH CÔNG THỨC CHẾ BIẾN

Sinh viên tham gia nghiên cứu: NGUYỄN MINH THỊNH Lớp: ĐH CNTT C19
Giảng viên hướng dẫn: TS Võ Thị Hồng Loan Phú Yên, 2022
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217 MỞ ĐẦU
Lý do chọn đề tài
Trong thời đại hiện nay, việc giới trẻ sử dụng mạng xã hội như Facebook,
Instagram, Twitter ngày càng được mở rộng, ở đó, các bạn trẻ có thể thỏa sức đăng
những hình ảnh về cuộc sống thường ngày, những hình ảnh vui chơi, giải trí,
những khoảnh khắc trong cuộc sống, trong đó có việc đăng tải những hình ảnh
món ăn. Đôi lúc, sẽ có nhiều người sẽ để ý và hứng thú, tuy nhiên họ không thể
biết được toàn bộ những nguyên liệu, cách nấu món ăn đó như thế nào. Vì vậy,
việc ứng dụng nhận diện hình ảnh Object Detection sẽ có thể giúp phân tích hình
ảnh món ăn thành công thức chế biến, có thể giúp được các cá nhân có hứng thú
với món ăn đó mà họ không biết được cách thức chế biến, nguyên liệu của món ăn đó [1].
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
Tổng quan tình hình nghiên cứu
Object Detection đề cập đến năng lực của mạng lưới hệ thống máy tính và
ứng dụng để xác định những đối tượng người dùng trong một hình ảnh và xác lập
từng đối tượng người dùng. Object Detection đã được sử dụng thoáng đãng để phát
hiện khuôn mặt, phát hiện xe, đếm số người đi bộ, mạng lưới hệ thống bảo mật
thông tin và xe không người lái. Có nhiều cách để nhận diện đối tượng người tiêu
dùng hoàn toàn có thể được sử dụng cũng như trong nhiều nghành nghề dịch vụ
thực hành thực tế. Giống như mọi công nghệ tiên tiến khác, một loạt những ứng
dụng phát minh sáng tạo và tuyệt vời của Object Detection sẽ đến từ những lập
trình viên và những nhà tăng trưởng ứng dụng [2].
Bắt đầu sử dụng những giải pháp nhận diện đối tượng người dùng văn minh
trong những ứng dụng và mạng lưới hệ thống, cũng như thiết kế xây dựng những
ứng dụng mới dựa trên những giải pháp này. Việc triển nhận diện đối tượng người
tiêu dùng sớm tương quan đến việc sử dụng những thuật toán cổ xưa, giống như
những thuật toán được tương hỗ trong OpenCV, thư viện computer vision thông
dụng. Tuy nhiên, những thuật toán cổ xưa này không hề đạt được hiệu suất đủ để
thao tác trong những điều kiện kèm theo khác nhau [3].
Điều gì giúp mở rộng công nghệ nhận diện hình ảnh ngày nay? Đó là các công cụ
mã nguồn mở giúp lập trình dễ dàng hơn. Trong khi đó giá cả thì ngày càng rẻ hơn.
Các khung công tác và thư viện nguồn mở giúp các công ty có thể hưởng lợi từ
công nghệ nhận diện hình ảnh theo cấp số nhân[4].
Hiện nay có rất nhiều định nghĩa về công nghệ nhận dạng hình ảnh. Nhận dạng
hình ảnh hay được biết đến với tên gọi khác là tầm nhìn máy tính. Đây là một
trong những kỹ thuật dùng để tìm kiếm các cách tự động hóa tất cả công việc mà
một hệ thống thị giác của con người có thể làm .
Ưu điểm lớn nhất của các dịch vụ mã nguồn mở nhận diện hình ảnh hiện nay là vô
kể. Ngoài việc tiến hành tính toán giúp nhận dạng hình ảnh trên đám mây, giúp cho
hoạt động kinh doanh trở nên hiệu quả hơn và rẻ hơn rất nhiều.Các API còn có thể
được tích hợp vào nội bộ công ty mà không gặp những trục trặc về bản quyền hay
sự cố. Thậm chí, các nhà phát triển API mở này có thể sử dụng để phát triển một
doanh nghiệp mới trong lĩnh vực nhận dạng hình ảnh.
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
Mục tiêu nghiên cứu
- - Tìm ra được các thành phần nguyên liệu của món ăn thông qua hình ảnh.
- - Tìm các công thức, cách nấu, chi tiết về các nguyên liệu.
Đối tượng và phạm vi nghiên cứu
1. Đối tượng nghiên cứu
- Công thức chế biến của một món ăn 2. Phạm vi nghiên cứu
- Các món ăn chính của người miền Trung
Phương pháp nghiên cứu
- Thực nghiệm: Khảo sát, ăn thử các món ăn chính trong bữa ăn của người miền Trung
- Nghiên cứu tài liệu: Tìm hiểu các món ăn chính của khu vực miền Trung thường nấu
Nội dung nghiên cứu
CHƯƠNG 1: NHẬN DIỆN HÌNH ẢNH VÀ KỸ THUẬT NHẬN DIỆN HÌNH ẢNH OBJECT DETECTION 1.1 Nhận diện hình ảnh
1.2 Kỹ thuật nhận diện hình ảnh Object Detection
CHƯƠNG 2: PHÂN TÍCH DỮ LIỆU HÌNH ẢNH MÓN ĂN THÀNH CÔNG THỨC CHẾ BIẾN 2.1 Mô tả hoạt động
2.2 Dữ liệu về hình ảnh món ăn 2.3 Cách thức phân tích
CHƯƠNG 3: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 3.1 Kết luận
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217 3.2 Hướng phát triển
CHƯƠNG 1: NHẬN DIỆN HÌNH ẢNH VÀ KỸ THUẬT NHẬN DIỆN HÌNH ẢNH OBJECT DETECTION 1.1 Nhận diện hình ảnh:
- Nhận diện hình ảnh hoặc thị giác máy tính là một kỹ thuật tìm kiếm các cách để
tự động hóa tất cả công việc mà một hệ thống thị giác của con người có thể làm.
- Những cái tên như TensorFlow của Google, DeepFace của Facebook, Dự án
Oxford của Microsoft. Chúng đều là những ví dụ tuyệt vời về hệ thống nhận diện
hình ảnh. Mặt khác, các API được lưu trữ cho phép các doanh nghiệp tiết kiệm một
số tiền lớn cho các nhóm phát triển. Ví dụ như Google Cloud Vision, Clarifai, Imagga…[5].
- Hình ảnh có thể được sử dụng theo những cách khác nhau.Trong các hình ảnh
phát triển phần mềm di động, web và phần mềm phục vụ cho vô số lý do, bao gồm:  Nhận diện đối tượng  Nhận diện mẫu 
Định vị các bản sao (chính xác hoặc một phần) 
Tìm kiếm hình ảnh theo phân đoạn  Xử lý ảnh (retouch,...) 
Cải thiện ứng dụng di động UX
- Tính ứng dụng của chúng là không giới hạn. Những tiến bộ trong công nghệ mở
ra nhiều cơ hội mới cho các doanh nghiệp. Do đó, phân tích hình ảnh được đưa đến
một cấp độ hoàn toàn mới. Điều này nhờ vào các giải pháp nguồn mở và các công
cụ học sâu (deep learning).
- Ưu điểm của các dịch vụ mã nguồn mở được đề cập rất nhiều. Các tính toán nhận
diện hình ảnh trong đám mây có một ưu điểm lớn. Đó là nó khiến hoạt động kinh
doanh trở nên hiệu quả và rẻ hơn rất nhiều. Ngoài ra, các nhà phát triển nội bộ của
doanh nghiệp có thể tích hợp API của họ vào ứng dụng mà không gặp sự cố.
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
1.2 Kỹ thuật nhận diện hình ảnh Object Detection:
- Một trong những lĩnh vực quan trọng của Trí tuệ nhân tạo (Artificial Intelligence)
là thị giác máy (Computer Vision). Computer Vision là một lĩnh vực bao gồm các
phương pháp thu nhận, xử lý ảnh kỹ thuật số, phân tích và nhận dạng các hình ảnh,
phát hiện các đối tượng, tạo ảnh, siêu phân giải hình ảnh và nhiều hơn vậy. Object
Detection có lẽ là khía cạnh sâu sắc nhất của thị giác máy do số lần sử dụng trong thực tế.
- Object Detection đề cập đến khả năng của hệ thống máy tính và phần mềm để
định vị các đối tượng trong một hình ảnh và xác định từng đối tượng. Object
Detection đã được sử dụng rộng rãi để phát hiện khuôn mặt, phát hiện xe, đếm số
người đi bộ, hệ thống bảo mật và xe không người lái. Có nhiều cách để nhận diện
đối tượng có thể được sử dụng cũng như trong nhiều lĩnh vực thực hành. Giống
như mọi công nghệ khác, một loạt các ứng dụng sáng tạo và tuyệt vời của Object
Detection sẽ đến từ các lập trình viên và các nhà phát triển phần mềm [6].
- Bắt đầu sử dụng các phương pháp nhận diện đối tượng hiện đại trong các ứng
dụng và hệ thống, cũng như xây dựng các ứng dụng mới dựa trên các phương pháp
này.Việc triển nhận diện đối tượng sớm liên quan đến việc sử dụng các thuật toán
cổ điển, giống như các thuật toán được hỗ trợ trong OpenCV, thư viện computer
vision phổ biến. Tuy nhiên, các thuật toán cổ điển này không thể đạt được hiệu suất
đủ để làm việc trong các điều kiện khác nhau.
- Các mô hình phát hiện đối tượng thường được đào tạo để phát hiện sự hiện diện
của các đối tượng cụ thể trong hình ảnh, video hoặc hoạt động thời gian thực (real
time). Ngay cả trước khi có phương pháp học sâu và công nghệ xử lý hình ảnh hiện
đại, việc phát hiện đối tượng vẫn được quan tâm rất nhiều. Khi đó người ta thường
ứng dụng một số phương pháp xử lý ảnh như SIFT và HOG với kỹ thuật trích xuất cạnh của vật thể[7].
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217 Object Detection
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
CHƯƠNG 2: PHÂN TÍCH DỮ LIỆU HÌNH ẢNH MÓN ĂN THÀNH CÔNG THỨC CHẾ BIẾN 2.1 Mô tả hoạt động:
Khi quét hình ảnh món ăn, hệ thống nhận diện hình ảnh sẽ bắt đầu hoạt động
để phân tích hình ảnh món ăn đó bao gồm: màu sắc, cách trình bày, hình ảnh món
ăn đó có ở các nền tảng khác hay không, các nguyên liệu, từ đó sẽ cho ra kết quả là
công thức của món ăn, nguyên liệu, cách chế biến.
2.2 Dữ liệu về hình ảnh món ăn:
- Dữ liệu về hình ảnh món ăn bao gồm các món được đăng tải trên các mạng
xã hội như Facebook, Instagram, các nền tảng Internet.
- Ngoài ra có thể quét dữ liệu về các món ăn ở đời thực, các món chính ở
miền Trung, các hình ảnh có sẵn trong các thiết bị như điện thoại, máy tính.
2.3 Cách thức hoạt động:
- Phân loại hình ảnh: Dự đoán nhãn của một đối tượng trong một hình ảnh.
+ Input: Một hình ảnh là ảnh của một món ăn chính của miền Trung
+ Output: Nhãn lớp của các thành phần món ăn đ
- Định vị đối tượng: Xác định vị trí hiện diện của các đối tượng trong ảnh và
cho biết vị trí của chúng bằng bounding box.
+ Input : Hình ảnh có một hoặc nhiều đối tượng, ví dụ như món cơm
chiên sẽ có các đối tượng như cơm, trứng, ...
+ Output: Một hoặc nhiều bounding box được xác định bởi tọa độ
tâm, chiều rộng và chiều cao.
- Phát hiện đối tượng: Xác định vị trí hiện diện của các đối tượng trong
bounding box và nhãn của các đối tượng nằm trong một hình ảnh.
+ Input: Hình ảnh món ăn chính của miền Trung
+ Output: Một hoặc nhiều bounding box và nhãn cho mỗi
bounding box, các bounding box sẽ bao phần thức ăn đó và đưa ra
nhãn là tên của loại nguyên liệu[8].
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
CHƯƠNG 3: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 3.1 Kết luận
Nhận diện món ăn thành công thức chế biến bằng kỹ thuật object detection
là một dự án có thể thực hiện được, nó có thể giải quyết đơn giản việc một cá nhân
có hứng thú với món ăn nhưng không thể tìm được công thức cũng như nguyên
liệu đầy đủ của món ăn đó 3.2 Hướng phát triển:
Nhận diện món ăn thành công thức chế biến bằng kỹ thuật object detection
sẽ được phát triển hơn nữa để ngoài việc phân tích các món ăn chính của người
miền Trung thì nó còn có thể phân tích nhiều hơn các món như món phụ, món ăn sáng, món ăn vặt, ....
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217 TÀI LIỆU THAM KHẢO [1]
“Trí tuệ nhân tạo biến hình ảnh món ăn thành công thức chế biến”, Báo
Nghệ An điện tử - Tin tức cập nhật trong ngày, 11 Tháng Mười 2018. [2]
“[Computer Vision] Object Detection (nhận diện vật thể) chỉ với 10 dòng
code sử dụng ImageAI”, Viblo, 15 Tháng Bảy 2018. [3]
“Deep learning: Nhận diện vật thể qua ảnh chụp”. [4]
“Giới thiệu một số thuật toán phát hiện đối tượng phổ biến”, VinBigData, 21 Tháng Ba 2022. [5]
“Phân biệt một số bài toán trong lĩnh vực Computer Vision – AI CLUB TUTORIALS”. [6]
Băng T., “Thu Thập Dữ Liệu Cho Deep Learning && Giới Thiệu Về
Imagenet”, 19 Tháng Ba 2020. [7]
T. Blog, “Thuật toán CNN - Convolutional Neural Network”, TopDev, 8 Tháng Tám 2019. [8]
“Tracking/theo vết đối tượng trong ảnh - Chương 1”, Mì AI, 6 Tháng Giêng 2020.
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
Downloaded by Van Le (mrl3v4n@gmail.com)