في عالم الذكاء الاصطناعي، تعتبر نماذج اللغات الضخمة (MLLMs) قوة دفع للتطور التكنولوجي، ولكن تواجهها تحديات كثيرة عند العمل في بيئات غير مستقرة. كشف بحث حديث عن مشكلة هامة تتعلق بالتنسيق المنطقي، حيث تختلف توزيعات التفكير بين النماذج المختلفة بشكل غير متوقع، مما ينقل انحيازات ونقاط ضعف للنموذج المستهدف.

لمعالجة هذه القضية، تم تقديم إطار عمل مبتكر يُعرف باسم تحسين التفضيلات الذاتية (Autonomous Preference Optimization - APO). هذا الإطار يعيد صياغة معضلة التنسيق بين النماذج المتعددة على أنها مشكلة قيود تحت نظرية تشتت المفاهيم. ينفذ APO بروتوكولاً مكونًا من مرحلتين؛ حيث تقوم المرحلة الأولى بالتدريب المراقب لتهيئة النموذج المستهدف داخل نطاق قدرات النماذج المصدرية، فيما تركّز المرحلة الثانية على تحسين القيود من خلال هدف Plackett-Luce السلبي المتعدد، ما يساهم في إنشاء تصورات منطقية متسقة.

أظهرت تجارب واسعة على تحليل الصور الشعاعية للصدر أن نموذجنا الذي يتكون من 7 مليارات خلية يتفوق في القوة والمثابرة، حيث يفوق دقة نماذج المصدر الاعتيادية. بالإضافة إلى ذلك، أطلقنا CXR-MAX، وهو معيار واسع النطاق يتضمن 170,982 مسار تفكير من سبع نماذج متميزة، وذلك لتسهيل الأبحاث في مجال تنسيق التفكير تحت تأثير التشتت.

لمعرفة المزيد عن هذا الإطار المبتكر وكيف يمكن أن يغير مستقبل التنسيق في الذكاء الاصطناعي، يمكنكم زيارة الرابط: https://github.com/XiaoyuYoung/APO.