في عالم الذكاء الاصطناعي، تُعتبر النماذج اللغوية الكبيرة (Large Language Models) من أبرز الابتكارات التكنولوجية، وقد أظهرت نجاحًا كبيرًا في العديد من المهام. ومع ذلك، لا تزال تواجه تحديات، وخاصة عندما يتعلق الأمر بالعمل مع الجداول. تنتج هذه النماذج أخطاء في استرجاع البيانات (Data Referencing Errors - DREs)، حيث تقوم بإغفال أو تقديم قيم غير صحيحة من الجداول، رغم فهمها الجيد لهياكلها.

تشير الدراسات السابقة إلى أن هذه الأخطاء ليست بسيطة، بل تؤثر على صحة وسلامة خطوات الاستدلال المتوسطة، وهذا ما يجعل البحث الأخير الذي تم إجراؤه حول تقييم منهجي لهذه المشكلات مستحقًا للاهتمام.

في هذا البحث، تم اختبار مجموعة متنوعة من النماذج تتراوح من 1.7 مليار إلى 20 مليار معلمة، وشملت النتائج ظهور DREs في جميع النماذج المختبرة. ووجد الباحثون أن إدراج النقد كآلية للتحسين قد رفع دقة الإجابات بمعدل يصل إلى 12%، مما يؤشر إلى أهمية التفكير في كيفية تعزيز دقة الطلبات الناتجة عن هذه النماذج.

علاوة على ذلك، تم تطوير نموذج نقدي خفيف الوزن بسعة 4 مليارات معلمة، نجح في تحقيق متوسط درجة F1 تبلغ 78.2% في اكتشاف الأخطاء، مساعدة في استنتاج أفضل من النماذج الأكبر. وهذا يفتح المجال لمزيد من الأبحاث والتطوير في هذا المجال المتسارع.

إجمالًا، يُظهر هذا العمل أهمية تصحيح DREs لزيادة موثوقية النماذج اللغوية، ويحفزنا على التفكير في كيفية استخدام هذه الاكتشافات لتحسين أداء الذكاء الاصطناعي في المستقبل.