في عالم يتزايد فيه استخدام الأجهزة المحمولة المزودة بكاميرات، أصبح التعرف على الطعام جزءاً أساسياً من مراقبة النظام الغذائي بواقع زمني. بينما تحقق نماذج التعلم العميق نجاحاً ملحوظاً في التصنيف العام، إلا أنها تواجه صعوبات في التقاط السمات الدقيقة مثل أساليب الطهي. ولذلك، تم تقديم إطار FoodCHA، الذي يعيد صياغة مشكلة التعرف على الغذائية كعملية اتخاذ قرارات هرمية. يقوم FoodCHA بتوجيه تحديد الفئات الفرعية بناءً على تصنيفات عالية المستوى، مما يساعد في تحسين الاتساق الدلالي والتمييز على مستوى السمات.

كما أن هذا النموذج يعتمد على نموذج Moondream-2B الرائع، الذي يجمع بين قوة التفكير مع ضغط الحوسبة والذاكرة. أظهرت التجارب على قاعدة بيانات FoodNExTDB أن FoodCHA يتفوق بأداء ملحوظ، حيث زاد دقة التعرف على الفئات بنسبة 13.8%، و38.2% في الفئات الفرعية، بالإضافة إلى تحسين مذهل بنسبة 153.2% في دقة تصنيف أسلوب الطهي. تعتبر هذه الإنجازات علامة فارقة في تطوير تقنيات الذكاء الاصطناعي المتخصصة في مجال التغذية الصحية.