Nhận dạng cây thuốc bằng ứng dụng di động

STNN - Nhóm tác giả ở Trường Đại học Yersin Đà Lạt đã phát triển một ứng dụng giúp người dân nhận dạng cây thuốc phổ biến với độ chính xác trên 90%, góp phần sử dụng tài nguyên dược liệu an toàn và hiệu quả.
nhan-dang-cay-thuoc-bang-di-dong-stnn-1747638185.png
Giao diện ứng dụng và kết quả nhận dạng. Ảnh: NNC.

Việt Nam có hơn 5.100 loài cây thuốc, trong đó nhiều loài rất quen thuộc nhưng cũng có không ít cây quý hiếm dễ bị nhầm lẫn. Việc phân biệt chính xác các loài cây thuốc rất quan trọng, đặc biệt ở nông thôn và miền núi – nơi người dân vẫn thường sử dụng thuốc nam trong chăm sóc sức khỏe.

Từ xưa, việc nhận biết cây thuốc thường dựa vào kinh nghiệm truyền miệng, nhìn vào hình dáng lá, hoa, thân hoặc ngửi mùi. Tuy nhiên, do nhiều cây có hình dạng tương đồng, việc nhận diện chính xác đòi hỏi hiểu biết chuyên sâu.

Để giải quyết vấn đề này, nhóm nghiên cứu ở Trường Đại học Yersin Đà Lạt đã phát triển một ứng dụng di động giúp người dân nhận dạng cây thuốc thông qua hình ảnh lá cây chụp trực tiếp bằng điện thoại. Ứng dụng sử dụng trí tuệ nhân tạo (AI), cụ thể là mô hình học sâu CNN – EfficientB0 (chuyên dùng để phân tích ảnh và nhận dạng tên loài dựa tên loài dựa vào đặc điểm hình học, màu sắc,…).

Nhóm đã thu thập hơn 800 ảnh chụp của 41 loài cây thuốc phổ biến tại Việt Nam từ các nguồn như Google Images, Flickr, ImageNet… Trong số đó có cây đại bi phân bố chủ yếu ở vùng Tây Nguyên và miền Trung; diệp hạ châu đắng mọc hoang nhiều nơi trên cả nước; cam thảo đất phân bố chủ yếu vùng Nam Bộ;...

Sau khi dán nhãn và chia tập dữ liệu, nhóm huấn luyện mô hình nhận diện trên điện thoại chạy Android 9.0. Kết quả cho thấy, với một bức ảnh lá cây được chụp ngoài thực địa, ứng dụng có thể xác định đúng loài cây với độ chính xác trên 90%.

Ứng dụng này có tên MePDetect. Khi người dùng chụp ảnh một chiếc lá, hệ thống sẽ nhận dạng loài cây, hiển thị tên khoa học, tên thường gọi, hình ảnh tham khảo, công dụng, bộ phận dùng... Ứng dụng cũng tích hợp mô hình MobileNetV2 (một mô hình mạng nơ-ron tích chập được giới thiệu vào năm 2018 bởi nhóm nghiên cứu Google), nhằm tăng tốc độ xử lý ảnh.

Nhóm đang tiếp tục nghiên cứu mở rộng tập dữ liệu, đặc biệt đối với một số loại cây thuốc đã có tuy nhiên tỷ lệ dự đoán đúng chưa cao. Đồng thời, cải thiện khả năng xử lý hình ảnh thực tế trong các môi trường không kiểm soát như ánh sáng yếu, nhiễu động và hình ảnh chất lượng thấp; triển khai hệ thống cập nhật mô hình tự động khi có dữ liệu mới, hoặc khi phát hiện các loại cây mới trong hệ thống.

Nghiên cứu được công bố trên Tạp chí Khoa học Đại học Cần Thơ, Số 2A/2025.