في عالم الذكاء الاصطناعي، تعتبر نماذج اللغات الضخمة (LLMs) من أبرز الابتكارات التي حظيت بشعبية كبيرة، وخصوصاً في مهام الاستدلال. لكنها قد تواجه تحديات كبيرة عند استخدام المعرفة الهيكلية، مثل الرسوم البيانية والجداول. هذه المعرفة غالباً ما يتم تحويلها إلى تمثيلات تسلسلية، مما يعرض النماذج لمشكلة نعرفها جميعاً: الهلاوس (hallucinations).
رغم توفر المعرفة الكافية، تنتج هذه النماذج مخرجات تبدو للوهلة الأولى غير دقيقة أو مشوشة. ولكن لماذا يحدث هذا؟ وفقاً لدراسة حديثة، تكشف النتائج أن هذه الهلاوس ليست نتيجة عشوائية، بل تظهر من ديناميكيات داخلية منتظمة.
أولاً، لوحظ أن التركيز أثناء عملية الانتباه يميل إلى التوجه نحو إشارات هيكلية مختصرة بدلاً من توزيع الانتباه عبر السياق الكامل. ثانياً، التمثيلات المستخدمة لا تدعم المعرفة المُعطاة بشكل كافٍ، مما يضطر النماذج للعودة إلى الذاكرة البارامترية.
وبالإضافة إلى ذلك، أظهرت الدراسات أن هذه الهلاوس غالباً ما ترتبط بفشل في توصيل المعاني داخل الطبقات المهمة، وهذا ما يؤدي إلى تباين أكبر في توزيع الانتباه بما يتناسب مع نوعية مهمة الاستدلال.
الأهم من ذلك، أن هذه الأنماط الميكانيكية يمكن أن تتجاوز الرسوم البيانية ذات الخطوة الواحدة (single-hop) لتشمل الإعدادات متعددة الخطوات (multi-hop) والجداول، مما يسهل اكتشاف الهلاوس عبر صيغ المعرفة الهيكلية.
تسليط الضوء على هذه الظواهر قد يساعد في تحسين أداء نماذج الذكاء الاصطناعي ويعزز من دقتها في تفسير البيانات الهيكلية. هل أنتم مستعدون لاكتشاف المزيد عن تطورات الذكاء الاصطناعي وأثرها على حياتنا اليومية؟
كيف تتسبب نماذج اللغات الضخمة في الانفصال عن الواقع عند استخدام المعرفة الهيكلية؟ تحليل ميكانيكي يسلط الضوء على المخاطر!
تظهر نماذج اللغات الضخمة (LLMs) مثل ChatGPT أحياناً مخرجات غير دقيقة عند استخدامها للمعرفة الهيكلية، مما يستدعي دراسة أعمق لفهم الأسباب وراء ذلك. تكشف الأبحاث أن هذه الظواهر ناجمة عن ديناميكيات داخلية منتظمة بدلاً من ضجيج عشوائي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
