
Chụp ảnh bữa ăn của bạn, và trí tuệ nhân tạo sẽ ngay lập tức cung cấp thông tin về lượng calo, hàm lượng chất béo và giá trị dinh dưỡng của bữa ăn đó, làm cho việc xác định các chỉ số dinh dưỡng không còn là phỏng đoán.
Giờ đây, điều này đã trở nên khả thi hơn bao giờ hết, nhờ vào hệ thống AI do các nhà nghiên cứu tại Trường Kỹ thuật Tandon thuộc Đại học New York phát triển. Hệ thống này hứa hẹn sẽ là công cụ hữu ích cho hàng triệu người có nhu cầu kiểm soát cân nặng, bệnh tiểu đường và các vấn đề sức khỏe liên quan đến chế độ ăn uống.
Công nghệ này đã được trình bày chi tiết trong một bài báo tại Hội nghị Quốc tế lần thứ 6 của IEEE về máy tính di động và tin học bền vững. Hệ thống sử dụng các thuật toán học sâu tiên tiến để nhận dạng các mặt hàng thực phẩm trong hình ảnh và tính toán hàm lượng dinh dưỡng của chúng, bao gồm calo, protein, carbohydrate và chất béo.
Trong hơn một thập kỷ qua, Nhóm Nghiên cứu Hỏa hoạn của Đại học New York (Fire Research Group), với tác giả chính là Prabodh Panindre và đồng tác giả Sunil Kumar, đã nghiên cứu các thách thức quan trọng liên quan đến sức khỏe và hoạt động của lính cứu hỏa. Nghiên cứu cho thấy từ 73% đến 88% lính cứu hỏa chuyên nghiệp và 76% đến 87% lính cứu hỏa tình nguyện gặp vấn đề thừa cân hoặc béo phì, đồng thời phải đối mặt với nguy cơ tim mạch và các vấn đề sức khỏe khác gia tăng, ảnh hưởng đến khả năng sẵn sàng hoạt động của họ. Những phát hiện này đã thúc đẩy sự phát triển của hệ thống theo dõi thực phẩm do trí tuệ nhân tạo cung cấp.
"Các phương pháp theo dõi lượng thức ăn tiêu thụ theo cách truyền thống thường phụ thuộc vào việc tự báo cáo, điều này có thể dẫn đến thiếu chính xác. Hệ thống của chúng tôi loại bỏ các sai sót do con người gây ra," Panindre, Phó Giáo sư Nghiên cứu tại Khoa Kỹ thuật Cơ khí của Trường Kỹ thuật Tandon thuộc Đại học New York, cho biết.
Mặc dù khái niệm này có vẻ đơn giản, việc phát triển trí tuệ nhân tạo có khả năng nhận dạng thực phẩm một cách chính xác đã gây khó khăn cho các nhà nghiên cứu trong nhiều năm. Những nỗ lực trước đây phải đối mặt với ba thách thức cơ bản, mà nhóm nghiên cứu tại NYU Tandon dường như đã vượt qua.
"Sự đa dạng hình ảnh của thực phẩm thật đáng kinh ngạc. Khác với các vật thể sản xuất có hình dạng chuẩn hóa, cùng một món ăn có thể có vẻ ngoài khác biệt đáng kể tùy thuộc vào người chế biến. Một chiếc bánh mì kẹp thịt từ một nhà hàng không giống với chiếc ở nơi khác, và các phiên bản tự làm còn phức tạp hơn," Kumar, Giáo sư Kỹ thuật Cơ khí tại NYU Abu Dhabi và Giáo sư Mạng lưới Toàn cầu về Kỹ thuật Cơ khí tại NYU Tandon, cho biết.
Các hệ thống trước đây gặp khó khăn trong việc ước tính kích thước khẩu phần, một yếu tố quan trọng trong tính toán dinh dưỡng. Tiến bộ của nhóm nghiên cứu NYU là khả năng tính toán thể tích, sử dụng công nghệ xử lý hình ảnh tiên tiến để đo diện tích chính xác mà mỗi loại thực phẩm chiếm trên đĩa.
Hệ thống này liên kết diện tích chiếm dụng của từng loại thực phẩm với dữ liệu về mật độ và chất dinh dưỡng đa lượng, từ đó chuyển đổi hình ảnh 2D thành đánh giá dinh dưỡng. Việc tích hợp các phép tính thể tích với mô hình trí tuệ nhân tạo này cho phép phân tích chính xác mà không cần nhập liệu thủ công, giải quyết một thách thức lâu đời trong việc theo dõi chế độ ăn uống tự động.
Rào cản lớn thứ ba là hiệu quả tính toán. Các mô hình trước đây yêu cầu một lượng lớn sức mạnh xử lý để hoạt động trong thời gian thực, thường phải xử lý dữ liệu trên đám mây, dẫn đến sự chậm trễ và lo ngại về quyền riêng tư.
Các nhà nghiên cứu đã áp dụng công nghệ nhận dạng hình ảnh tiên tiến mang tên YOLOv8 kết hợp với ONNX Runtime (một công cụ giúp tối ưu hóa hiệu suất cho các chương trình AI) để phát triển một hệ thống nhận dạng thực phẩm chạy trực tiếp trên trang web, thay vì dưới dạng ứng dụng tải xuống. Điều này cho phép người dùng chỉ cần truy cập trang web thông qua trình duyệt trên điện thoại để phân tích bữa ăn và theo dõi chế độ ăn uống của mình.
Khi thử nghiệm trên một lát pizza, hệ thống đã tính toán được 317 calo, 10 gram protein, 40 gram carbohydrate và 13 gram chất béo, với giá trị dinh dưỡng gần giống với tiêu chuẩn tham chiếu. Hệ thống cũng hoạt động hiệu quả khi phân tích các món ăn phức tạp hơn, chẳng hạn như idli sambhar, một đặc sản của Nam Ấn Độ gồm bánh gạo hấp và món hầm đậu lăng, với kết quả tính toán là 221 calo, 7 gram protein, 46 gram carbohydrate và chỉ 1 gram chất béo.
Panindre cho biết: "Một trong những mục tiêu của chúng tôi là đảm bảo hệ thống có khả năng hoạt động hiệu quả trên nhiều nền ẩm thực và cách trình bày món ăn khác nhau. Chúng tôi muốn hệ thống chính xác trong việc định lượng các món ăn như xúc xích, với giá trị 280 calo, cũng như baklava, một loại bánh ngọt Trung Đông mà hệ thống của chúng tôi xác định có 310 calo và 18 gram chất béo."
Các nhà nghiên cứu đã giải quyết các thách thức về dữ liệu bằng cách kết hợp các danh mục thực phẩm tương tự, loại bỏ các loại thực phẩm có quá ít ví dụ và nhấn mạnh thêm vào một số loại thực phẩm nhất định trong quá trình đào tạo. Các kỹ thuật này đã giúp tinh chỉnh tập dữ liệu đào tạo của họ từ vô số hình ảnh ban đầu thành một tập hợp cân bằng hơn gồm 95.000 trường hợp trên 214 danh mục thực phẩm.
Các số liệu hiệu suất kỹ thuật rất ấn tượng: hệ thống đạt được điểm Độ chính xác trung bình (mAP) là 0,7941 ở ngưỡng Giao điểm trên Liên hợp (IoU) là 0,5. Đối với những người không chuyên, điều này có nghĩa là AI có thể định vị và nhận dạng chính xác các mặt hàng thực phẩm khoảng 80% thời gian, ngay cả khi chúng chồng lên nhau hoặc bị che khuất một phần.
Hệ thống đã được triển khai dưới dạng ứng dụng web hoạt động trên các thiết bị di động, giúp bất kỳ ai có điện thoại thông minh đều có thể truy cập. Các nhà nghiên cứu mô tả hệ thống hiện tại của họ là một "bằng chứng khái niệm" có thể được tinh chỉnh và mở rộng cho các ứng dụng chăm sóc sức khỏe rộng hơn rất sớm.