في عالم الذكاء الاصطناعي، يعد فهم الأجزاء التي تسهم في نتائج نماذج اللغة الضخمة (Large Language Models) أمرًا غاية في الأهمية. حيث تعزز هذه الفهم إمكانية بناء نماذج موثوقة وقابلة للتفسير. في هذا الإطار، نقدم طريقة مبتكرة تصوغ مسألة النسب السياقية كمشكلة Bandit متعددة الأذرع (Multi-Armed Bandit Problem).

نستخدم تقنية **Thompson Sampling** الخطي لتحديد الأجزاء الأكثر تأثيرًا في السياق بفعالية، مع الحد من عدد الاستفسارات التي تقوم بها النماذج. تعتمد وظيفة المكافأة لدينا على احتمالات السجلات (Token Log-Probabilities)، مما يقيس مدى دعم مجموعة من الأجزاء للاستجابة الأصلية. وهذا يجعلها قابلة للتطبيق على كل من النماذج مفتوحة المصدر والنماذج التي تعتمد على واجهات برمجة التطبيقات المحجوبة (Black-Box API).

يتميز نهجنا عن الطرق التقليدية كنهج SHAP، الذي يعتمد على أخذ عينات موحدة من المجموعات، وذلك من خلال prioritizing المجموعات المفيدة بناءً على التقديرات اللاحقة لأهمية الأجزاء. هذه الطريقة تقلل من التكاليف الحسابية مع تحسين الأداء.

أظهرت التجارب على عدة معايير لمراجعة الأسئلة والأجوبة (QA Benchmarks) أن طريقتنا تحقق تقليصًا يصل إلى 30% في استفسارات النماذج، مع مطابقة أو تجاوز جودة التقدير لأساليب موجودة. يمكنكم الوصول إلى الشيفرة المصدرية الخاصة بنا في هذا الرابط [Github](https://github.com/pd90506/camab).

ما رأيكم في هذه الطريقة الجديدة لتحسين أداء النماذج اللغوية؟ شاركونا آرائكم!