لا تزال مشكلات الهلاوس، أي المخرجات التي تبدو صحيحة ولكنها في الواقع غير دقيقة، تمثل تحدياً كبيراً لنماذج اللغات الضخمة (LLMs) المفعّلة. فمثلاً، في عمليات توليد الأكواد، تقوم هذه النماذج غالباً بتخيل حزم برمجية غير موجودة، مما يؤدي إلى توصيات لعمليات استيراد وأوامر تثبيت لحزم خيالية. هذه المشكلة تمثل ثغرة حرجة في سلسلة الإمدادات: حيث يمكن أن يقوم المهاجمون بتسجيل تلك الحزم الوهمية على السجلات العامة مع حمولات ضارة، يمكن بعدها تثبيتها وتنفيذها من قبل المطورين أو الوكلاء الذاتيين. يُعرف هذا الهجوم بنمط 'slopsquatting'.
تسليط الضوء على هذه الإشكالية، قامت دراسة حديثة بتقديم استراتيجية مبتكرة تُعرف باسم 'التعلم التكيفي غير الموجه' (Adaptive Unlearning)، وهي إطار عمل مابعد النشر يهدف إلى تقليل الهلاوس بشكل دقيق مع الحفاظ على فعالية النماذج العامة. تتيح هذه الاستراتيجية تعزيز المخرجات الصvalidة، وفي الوقت نفسه تقليل الهلاوس، عبر هدف مختلط على مستوى الرموز.
علاوة على ذلك، يقدم الإطار حلقة اكتشاف تكيفية تعمل على الكشف المستمر عن السياقات المسببة للهلاوس دون الحاجة إلى إشراف بشري، مما يمكّن من التعميم على التحفيزات والهلاوس غير المرئية. تشير النتائج إلى أن 'التعلم التكيفي غير الموجه' قد نجح في تقليل معدلات الهلاوس المتعلقة بالحزم بنسبة 81%، مما يسهم بشكل كبير في تقليل خطر هجمات 'slopsquatting'، مع الحفاظ على الأداء في معايير البرمجة القياسية. كما تُظهر التحليلات أن التغيرات في التوزيع تتركز بشكل أساسي على توليدات الحزم، مما يُبقي سلوك البرمجة العامة دون تأثير كبير. تعمل هذه الاستراتيجية بالكامل على البيانات التي تم توليدها بواسطة النموذج، ولا تتطلب أي تعليقات بشرية، وتعمم عبر المجالات المختلفة.
محاربة هلاوس نماذج الذكاء الاصطناعي: استراتيجية مبتكرة لتقليل الأخطاء عبر التعلم التكيفي
تكشف دراسة جديدة عن استراتيجية مبتكرة تُعرف باسم 'التعلم التكيفي غير الموجه' (Adaptive Unlearning)، التي تهدف إلى تقليل هلاوس نماذج اللغات الضخمة (Large Language Models) مع الحفاظ على فعالية الأداء. هذه الاستراتيجية توفر حلاً لمشكلة الأخطاء الفادحة في واجهات البرمجة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
