في عالم الذكاء الاصطناعي، تبرز [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) بقدرتها على التعامل مع [البيانات](/tag/البيانات) اللغوية بفعالية عالية. ومع ذلك، كشفت [دراسة](/tag/دراسة) حديثة عن مشكلة مثيرة للاهتمام تتعلق بانحياز الإفراط في الاتصال، حيث تظهر هذه [النماذج](/tag/النماذج) ميلًا مستمرًا لاستدعاء [الأدوات](/tag/الأدوات) (tools) حتى في الحالات التي لا تتطلب ذلك.

تُظهر نتائج [دراسة](/tag/دراسة) يتم الإبلاغ عنها [عبر](/tag/عبر) [منصة](/tag/منصة) arXiv، أن ستة [نماذج](/tag/نماذج) تنتمي إلى ثلاث [عائلات](/tag/عائلات) تظهر [دقة](/tag/دقة) متوسطة عندما يتعلق الأمر باستدعاء أدوات، لكن [دقة](/tag/دقة) عدم استدعاء [الأدوات](/tag/الأدوات) كانت أقل بكثير. تراوحت [الدقة](/tag/الدقة) الكلية بين 55% و70%.

تفسر [الدراسة](/tag/الدراسة) هذا الانحياز من خلال فرضية الانحياز الداخلي (Intrinsic [Bias](/tag/bias) Hypothesis - IBH)، حيث يتمثل في أن القرار الخاص بالاتصال أو عدم الاتصال يحمل «إزاحة اتصال» مستقلة عن التنشيط، مما يعني أن [النماذج](/tag/النماذج) تميل أكثر للاتصال حتى وإن كانت قدرات التنشيط متساوية.

من أجل معالجة هذه المشكلة، تم استخدام [المحولات](/tag/المحولات) النادرة (Sparse [Autoencoders](/tag/autoencoders) - [SAEs](/tag/saes)) لاستعادة الخصائص المرتبطة بسلوك [النماذج](/tag/النماذج) في اتخاذ [قرارات](/tag/قرارات) الاتصال، مع تقليصها إلى هامش [تنشيط](/tag/تنشيط) مضمن وتقدير الإزاحة بشكل مباشر. أثبتت النتائج أن النموذج يكون محايدًا فقط عندما يتفوق [تنشيط](/tag/تنشيط) «عدم الاتصال» على [تنشيط](/tag/تنشيط) «الاتصال»، بما يتماشى مع فرضية IBH.

لمعالجة هذا الانحياز، تم اختبار فرضية IBH بشكل سببي باستخدام [تقنية](/tag/تقنية) [توجيه](/tag/توجيه) الهامش المعاكس (Adaptive Margin-Calibrated Steering - AMCS)، والتي توفر تعديلات فعالة على [قرار](/tag/قرار) الاتصال، مما ساهم في تقليل الإفراط في الاتصال وتحسين [الدقة](/tag/الدقة) العامة للنماذج مع انخفاض طفيف في [دقة](/tag/دقة) الاتصال.

هذا [البحث](/tag/البحث) يسلط الضوء على كيفية إعادة [تفسير](/tag/تفسير) الإفراط في الاتصال كظاهرة يمكن معالجتها من خلال خطوات ميكانيكية وعلمية. يتيح ذلك للنماذج [تحسين](/tag/تحسين) أدائها وتعزيز موثوقيتها في المستقبل.

للمهتمين بالتفاصيل التقنية، يمكنكم الاطلاع على [الكود البرمجي](/tag/[الكود](/tag/الكود)-البرمجي) المتاح على موقع [GitHub](/tag/github) [هنا](https://github.com/SKURA502/agent-sae/). فما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات)!