تعتبر نماذج مزيج الخبراء (Mixture-of-Experts) من أبرز الابتكارات في مجال الذكاء الاصطناعي، حيث تقدم ميزات هائلة من حيث القدرة على التوسع والتكيف مع البيانات المتعددة. إلا أن هذه الأنظمة تعاني من مشكلة الهلاوس، وخاصة عند تعاملها مع أنواع معينة من المعرفة مثل المعلومات قليلة التكرار.
توضح دراسات حديثة أن الضعف الذي تواجهه هذه النماذج يرجع إلى اعتماده على التوجيه الثابت، حيث يميل المُوجّهون إلى تفضيل الأنماط الشائعة على الارتباطات النادرة. ونتيجة لذلك، يتم تجاهل "الخبراء المتخصصين" الذين يمتلكون المعرفة الحيوية الطويلة الذيل، مما يعوق أدائهم.
لمعالجة هذه المشكلة، نقدم تقنية التوجيه المضاد (Counterfactual Routing - CoR). تهدف هذه التقنية إلى إيقاظ هؤلاء الخبراء النائمين من خلال دمج تحليل التذبذبات بين الطبقات مع قياس تأثير الخبراء المضاد (Counterfactual Expert Impact - CEI).
تعمل CoR على تحويل الموارد الحاسوبية بشكل ديناميكي من الطبقات التركيبية إلى الطبقات الأكثر معرفة، مع الحفاظ على عدد معين من التنشيطات. وقد أظهرت الاختبارات المكثفة على نماذج مثل TruthfulQA وFACTOR وTriviaQA أن هذه التقنية تحسن الدقة الواقعية بمعدل 3.1% دون زيادة ميزانية الاستنتاج، مما يسجل نقطة تفوق مقارنة بالاستراتيجيات الثابتة.
إن هذا الابتكار لا يسهم فقط في تحسين أداء نماذج مزيج الخبراء، بل يفتح أيضًا آفاقًا جديدة في كيفية استخدام الذكاء الاصطناعي للتعامل مع المعلومات المهمة التي قد تكون مهددة بالنسيان.
إيقاظ الخبراء النائمين: كيف يمكن لتقنية التوجيه المضاد تعزيز دقة نماذج الخبراء المتعددة؟
تعاني نماذج مزيج الخبراء من الهلاوس، مما يؤثر على أدائها عند التعامل مع معرفة طويلة الذيل. نقدم تقنية التوجيه المضاد لإيقاظ الخبراء المتخصصين الذين يمتلكون معرفة حيوية وتحسين الدقة دون زيادة تكلفة الاستنتاج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
