تعتبر نماذج اللغات الضخمة (Large Language Models) من أبرز التطورات في مجال الذكاء الاصطناعي، ولكنها تواجه تحديات معقدة عند محاولة إجراء عمليات بحث متعددة الخطوات. على الرغم من قدرتها على معالجة معلومات من سياقات واسعة، إلا أن هذه النماذج قد تعاني من حاجة ملحة للتغلب على ما يُعرف بالتحيز المكاني (position bias) الذي يؤدي بها إلى تجاهل معلومات مهمة في مراكز معينة.
في جديد الأبحاث، تم تقديم مفهوم جديد يُعرف باسم **تعليم الانتباه متعدد النقاط (Multi-Focus Attention Instruction - MFAI)**. يهدف هذا الأسلوب إلى تحسين قدرة النماذج على جذب الانتباه نحو مواقع معينة، مما يساعد في فك تلك التعقيدات المتعلقة بتعطيل عملية التعرف ودمج المعلومات.
خلال التجارب التي شملت خمسة نماذج لغوية ضخمة في مهمتين من مهام البحث متعدد الخطوات (MuSiQue و NeoQA)، تم اكتشاف تأثير يطلق عليه **تأثير الحلقة الأضعف**. حيث أظهرت النتائج أن أداء النماذج ينخفض بشكل كبير إلى مستوى أقل المعلومات وضوحًا، مما يعني أن الأداء ليس بالضرورة مرتبطًا بالمسافة الخطية بين الحقائق، بل بالموقع المطلق للمعلومات.
عندما تم استخدام MFAI بشكل متوازن، لوحظ تحسن بمعدل يصل إلى 11.49% في الدقة في الأماكن ذات الرؤية المنخفضة. ومع ذلك، إذا تم استخدام MFAI بشكل مضلّل، فقد تظهر تأثيرات متباينة تؤثر على أنواع محددة من المهام. كانت المهام التي تركز على الكيانات مع سلاسل تفكير عمودية أكثر عرضة للضعف، بينما كانت المهام التي تركز على الأحداث أكثر مرونة أمام هذه التحديات.
أخيرًا، تم إثبات أن النماذج التي تستخدم أسلوب التفكير من النظام الثاني (System-2 reasoning) تستطيع أن تحدد وتقارن المعلومات المطلوبة بشكل فعال، متطابقة مع مستويات الأداء المعيارية حتى في السياقات الضوضائية والطويلة.
تجارب إضافية على مجموعة بيانات 2WikiMultiHopQA وامتدادات الخطوات من 3-4 وموديل بحجم 32B أكدت أن هذه النتائج قابلة للتعميم عبر مجموعات البيانات وأعماق التفكير وأحجام النماذج.
هل تعتقد أن ممثلين الذكاء الاصطناعي سيتمكنون من تخطي هذه العقبات في المستقبل؟ شارك برأيك في التعليقات!
اكتشاف أعطال البحث متعدد الخطوات: تأثير الحلقة الأضعف وزجاجة التعرف
تواجه نماذج اللغات الضخمة تحديات كبيرة في البحث متعدد الخطوات بسبب biases مكانية. نقدم مفهوم MFAI لتحسين الأداء وكشف النقاط الضعيفة في عملية التعرف.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
