في عالم الذكاء الاصطناعي، تُعتبر مقاربة قابلية التفسير (Interpretability) مكوناً أساسياً لفهم كيفية عمل النماذج. ومع تزايد الحاجة إلى تفسير الخوارزميات، بدأ الباحثون في التركيز على مجموعات من العناصر بدلاً من الوحدات الفردية. جاءت هذه الدراسة الحديثة لتسلط الضوء على مدى فعالية إحصائيات التفعيل المشترك (Co-activation statistics) في تحديد دوائر الرؤوس الانتباهية (Attention Heads).
يتساءل الباحثون هنا عما إذا كانت هذه الإشارات الاقتصادية البسيطة كافية لتحديد وجود دائرة في الرؤوس الانتباهية. من خلال تكييف وصفة تجميع استشعاري الأوتوماتيكي (Sparse-autoencoder clustering) للرؤوس الانتباهية، نجحوا في إجراء اختبار الإغلاق (Closure Test) والذي يتضمن استبعاد المجتمع المكتشف ومقارنة الأضرار الناتجة مع تحكمات عشوائية متطابقة.
أظهرت النتائج عبر نموذجين بحجم 1B (Pythia 1B وOLMo 1B) وتوزيعتين لدخل البيانات، أن المجتمعات التي تم اكتشافها قد تجاوزت اختبار الإغلاق. ومع ذلك، في نموذج ميكسچر أوف إكسبيرتس (Mixture-of-Experts) مثل OLMoE-1B-7B، كانت النتيجة مختلفة حيث استعادت تجميعات حالة الظروف الموجهة إشارة إحصائية حقيقية لكنها لم تنجح في اختبار الإغلاق.
يؤكد البحث أن إشارة رخيصة قد تقترح وجود دائرة، ولكن لا تؤكدها. يُعد اختبار الإغلاق هو الذي يميز بين الاقتراحات المؤكدة والاقتراحات المبدئية. هذه النتائج تقدم رؤى جديدة حول كيفية تطور فهمنا لمكونات الذكاء الاصطناعي وكيف يمكن أن تؤثر على مستقبل الأبحاث في هذا المجال.
اكتشاف الدوائر المعتمدة على الإغلاق في الرؤوس الانتباهية: فعالية التفعيل المشترك وإخفاقات الاستبعاد
بحث جديد يكشف عن كيفية استخدام إحصائيات التفعيل المشترك لتحديد دوائر الرؤوس الانتباهية في نماذج الذكاء الاصطناعي. النتائج تشير إلى أن هذه الإشارات لا تؤكد وجود الدوائر بل تقترحها فقط.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
