مع تزايد الاعتماد على نماذج اللغة الكبيرة (Large Language Models) في مجالات الزراعة، من تفسير المحاصيل إلى إنتاج صور حقول صناعية، تبرز ظاهرة الهلوسة كمشكلة رئيسية تثير القلق. هذه النماذج، على الرغم من ثقتها العالية في نتائجها، غالبًا ما تنتج مخرجات غير دقيقة تصور الواقع البيولوجي أو البيئي بشكل خاطئ، مما قد يؤدي إلى استنتاجات زراعية مغلوطة.
تتناول دراسة حديثة هذه الهلوسة من خلال تحليل اتجاهين رئيسيين: الأول هو تحويل الصورة إلى نص، حيث تقوم نماذج مثل Gemma و LLAVA و Qwen بتفسير الصور الزراعية لوصف الظروف البيئية مثل الضغوط الحيوية وغير الحيوية. والثاني هو تحويل النص إلى صورة، حيث تولد هذه النماذج مشاهد زراعية صناعية بناءً على أوامر وصفية.
أظهرت النتائج وجود أخطاء تتعلق بعدم التناسق البيولوجي والدقة السياقية، حيث سجلت نماذج الصورة إلى نص دقة إجمالية تتراوح بين 63% و75% في اختبارات عدم الاعتماد على البيانات، مع تحسن هذا الأداء إلى 86.8% مع استخدام تقنيات الإدخال القليل. لكن، رغم هذه التحسينات، لا تزال هذه النماذج تواجه مشكلات في الكشف عن الأمراض ونتائج كاذبة.
أما في مهام تحويل النص إلى صورة، فقد أنتجت نماذج متقدمة مثل GPT-5 وGemini 2.5 Flash حتى 91% من المشاهد غير المتناسقة بيولوجيًا. تكشف هذه التحليلات النظامية عن أنماط متكررة من الهلوسة، مما يؤدي إلى تسليط الضوء على نقاط الضعف الأساسية في النماذج الحالية.
هذه الدراسات تدعم الحاجة إلى تعزيز موثوقية منصات التصوير الزراعي المعتمدة على نماذج اللغة الكبيرة، مما يؤكد أهمية التقييم الدقيق للنتائج لتحسين التطبيقات المستقبلية.
استكشاف سلوك الهلوسة في نماذج اللغة متعددة الوسائط: تحديات جديدة في الزراعة الرقمية
تشهد نماذج اللغة الكبيرة (LLMs) قفزة نوعية في تطبيقات الزراعة الرقمية، إلا أن سلوك الهلوسة يُظهر مشكلات في دقة النتائج. دراسة حديثة تكشف عن كيفية تأثير هذه الظاهرة على تفسيرات الصور الزراعية وإنتاجها.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
