مع التطورات الحديثة في نماذج الرؤية واللغة (Vision-Language Models - VLMs)، أصبحت لها تأثيرات ملحوظة على مختلف الصناعات، وعلى وجه الخصوص، في القطاع الزراعي. حيث توفر هذه النماذج متعددة الوسائط إمكانيات واعدة لتطبيقات مثل الزراعة الدقيقة، ومراقبة المحاصيل، واكتشاف الآفات، وتعزيز الاستدامة البيئية.
لكن تكمن المشكلة في أن العديد من مجموعات البيانات الخاصة بالإجابة على الأسئلة البصرية (Visual Question Answering - VQA) والمعايير المتبعة غالبًا ما تعجز عن تقييم مهارات التفكير النقدي وحل المشكلات اللازمة في سياقات زراعية معقدة. ولذلك، تم ابتكار مجموعة بيانات AgroCoT، التي تم تصميمها خصيصًا لتقييم قدرات التفكير المنطقي في نماذج VLMs.
تتكون مجموعة بيانات AgroCoT من 4,759 عينة تم تنسيقها بعناية، وتوفر تقييمًا شاملًا وقويًا لقدرات التفكير، لا سيما في سيناريوهات عدم التوجيه (Zero-Shot)، مما يركز على قدرة النماذج على الانخراط في التفكير المنطقي وحل المشكلات بشكل فعال.
أظهرت تقييماتنا لـ 30 نموذجًا تمثيليًا من VLMs، بما في ذلك نماذج خاصة ومفتوحة المصدر، وجود فجوة ملحوظة في قدراتها على التفكير، مما يبرز أهمية دمج مفهوم التفكير المنطقي في التقييمات. يمكن الوصول إلى مجموعة بيانات AgroCoT عبر الرابط: https://huggingface.co/datasets/AgroCoT/AgroCoT.
تؤكد هذه المبادرة على أهمية تطوير معايير تقييمية فعالة تلبي احتياجات الزراعة المعاصرة وترفع من كفاءة النماذج المستخدمة.
AgroCoT: معيار مبتكر لتقييم التفكير المنطقي في نماذج الرؤية واللغة في الزراعة
تم الكشف عن مجموعة بيانات AgroCoT الجديدة التي تركز على تقييم قدرات التفكير المنطقي في نماذج الرؤية واللغة (VLMs) في السياقات الزراعية. هذه المبادرة تعد خطوة مهمة لتحسين دقة النماذج في تطبيقات الزراعة الدقيقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
