في عالم الذكاء الاصطناعي، تعد نماذج اللغة كبيرة الحجم (Large Language Models) من أهم الأدوات التي يعتمد عليها الكثيرون للقيام بمختلف المهام. ومع ذلك، فإن هذه النماذج تميل أحياناً إلى تقديم إجابات واثقة لكنها خاطئة عندما تواجه عدم اليقين. هذه المشكلة تتفاقم بشكل أكبر مع نماذج اللغة الصغيرة (SLMs)، حيث تسلط القيود الحسابية والحاجة للتشغيل الذاتي الضوء على أهمية الكشف الموثوق عن عدم اليقين.
لذلك، نقدم لكم تقنية 'ثاني تخمين' (Second Guess)، وهي تقنية خفيفة، لا تتطلب معلمات إضافية، تهدف إلى تعزيز القدرة على الامتناع عن الإجابة في استبيانات الخيارات المتعددة (Multiple-Choice Question Answering - MCQA). يكمن الابتكار الأساسي في أن النماذج التي تعرف الإجابة حقًا ستختارها باستمرار، بينما ستظهر النماذج المشككة سلوكاً غير مستقر عندما يتم إضافة خيار "لا أعرف".
لقد تم تقييم 'ثاني تخمين' على أربعة نماذج مفتوحة المصدر تتراوح من 2 إلى 8 مليار معلمة، وأربعة معايير مختلفة، لتخرج بنتيجة مذهلة تحسن بنسبة 10.81% في المخاطر المركبة. بشكل مثير، تحافظ هذه التقنية على تحسين بنسبة 8% في نماذج مُعدلة بدقة، الأمر الذي يعدّ تميزاً في الوقت الذي تتدهور فيه الأساليب المعتمدة على الانتروبيا. كما تفيد بشكل أكبر النماذج ذات الأداء الأدنى، مما يؤكد على فعالية هذه التقنية الجديدة في بيئات الموارد المحدودة.
تمت مشاركة كل من الكود والنتائج اللازمة لإعادة إنتاج هذا العمل على الموقع GitHub. في عالم يتزايد فيه الاعتماد على الذكاء الاصطناعي، تفتح 'ثاني تخمين' آفاقاً جديدة لتعزيز فعالية نماذج اللغة الصغيرة ومساعدتها في اتخاذ قرارات أكثر دقة.
ثاني تخمين: كيف نكشف عن عدم اليقين في نماذج اللغة الصغيرة
نحو تطوير أفضل لكفاءة نماذج اللغة الصغيرة (SLMs)، تأتي تقنية 'ثاني تخمين' لتدعيم الكشف عن عدم اليقين في الإجابات. هذه التقنية تقدم أسلوباً خفيفاً وفعّالاً لتحسين دقة الاستجابات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
