تواجه [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)) [تحديات](/tag/تحديات) كبيرة تتعلق بظهور ما يُعرف بالهلوسات، وهي استجابات ملائمة لكنها غير دقيقة من الناحية الواقعية. بينما كانت الدراسات السابقة تُعزو هذه الظاهرة إلى نقص في المعرفة، يكشف [بحث](/tag/بحث) [جديد](/tag/جديد) أن هذه الهلوسات يمكن أن تحدث حتى في وجود [المعرفة](/tag/المعرفة) المطلوبة. يُشير [البحث](/tag/البحث) إلى أن الأمر يتعلق بعدم [استقرار](/tag/استقرار) الاسترجاع أكثر من كونه نقصاً في [المعرفة](/tag/المعرفة).
ولفهم هذه الظاهرة بشكل أفضل، تم تقديم إطار هندسي [جديد](/tag/جديد) يُسمى "APORIA"، الذي يعني "جمع الملاحظات حول عدم [استقرار](/tag/استقرار) الاسترجاع [عبر](/tag/عبر) غير التماثل". يركز هذا الإطار على [دراسة](/tag/دراسة) الردود المتكررة لنفس الطلب في [فضاء](/tag/فضاء) تمثل الجمل، ويعد فرضنا المركزي هو أن الردود الصحيحة تتجمع بشكل أكثر تماسكًا مقارنة بالردود الهلوسية.
من خلال [التجارب](/tag/التجارب) العملية، تم [التحقق](/tag/التحقق) من [صحة](/tag/صحة) هذا المفهوم، حيث أصبحت الفئات المختلفة من الردود تتباين بشكل واضح بعد إجراء التحويل باستخدام طريقة "فشر". مما يتيح لنا [استغلال](/tag/استغلال) هذا [التباين](/tag/التباين) باستخدام طريقة [تصنيف](/tag/تصنيف) فعّالة يُطلق عليها "APORIA-LP"، حيث يمكن [تصنيف](/tag/تصنيف) مجموعة كبيرة من الردود باستخدام أقل من 30-50 توضيح، محققًا درجات F1 تزيد عن 90% [عبر](/tag/عبر) عشر [نماذج صغيرة](/tag/[نماذج](/tag/نماذج)-صغيرة).
وبهدف [دعم](/tag/دعم) المزيد من [الأبحاث](/tag/الأبحاث) في هذا المجال، تم إصدار [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) "SOCRATES-300K"، التي تشمل 300,000 رد مع علامات كاملة، بالإضافة إلى الشيفرة اللازمة لتوليد هذه [البيانات](/tag/البيانات) وإعادة إنتاج النتائج. تكمن أهمية هذه النتائج في إعادة صياغة فهمنا للهلوسات من منظور هندسي، مما يمكّن من فتح آفاق جديدة للأبحاث في مجالات أخرى تخص [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي).
تحليل هندسي يُكشف الأسباب وراء هلوسات نماذج اللغة الصغيرة!
تكشف دراسة جديدة عن الأسباب الجذرية وراء هلوسات نماذج اللغة الصغيرة (Small-sized Language Models)، حيث تتجاوز العوامل المعروفة مثل نقص المعرفة. انضموا إلينا لاستكشاف هذا الإطار الهندسي المبتكر!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
