في عالم الذكاء الاصطناعي، تبرز [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) بقدرتها على التعامل مع [البيانات](/tag/البيانات) اللغوية بفعالية عالية. ومع ذلك، كشفت [دراسة](/tag/دراسة) حديثة عن مشكلة مثيرة للاهتمام تتعلق بانحياز الإفراط في الاتصال، حيث تظهر هذه [النماذج](/tag/النماذج) ميلًا مستمرًا لاستدعاء [الأدوات](/tag/الأدوات) (tools) حتى في الحالات التي لا تتطلب ذلك.
تُظهر نتائج [دراسة](/tag/دراسة) يتم الإبلاغ عنها [عبر](/tag/عبر) [منصة](/tag/منصة) arXiv، أن ستة [نماذج](/tag/نماذج) تنتمي إلى ثلاث [عائلات](/tag/عائلات) تظهر [دقة](/tag/دقة) متوسطة عندما يتعلق الأمر باستدعاء أدوات، لكن [دقة](/tag/دقة) عدم استدعاء [الأدوات](/tag/الأدوات) كانت أقل بكثير. تراوحت [الدقة](/tag/الدقة) الكلية بين 55% و70%.
تفسر [الدراسة](/tag/الدراسة) هذا الانحياز من خلال فرضية الانحياز الداخلي (Intrinsic [Bias](/tag/bias) Hypothesis - IBH)، حيث يتمثل في أن القرار الخاص بالاتصال أو عدم الاتصال يحمل «إزاحة اتصال» مستقلة عن التنشيط، مما يعني أن [النماذج](/tag/النماذج) تميل أكثر للاتصال حتى وإن كانت قدرات التنشيط متساوية.
من أجل معالجة هذه المشكلة، تم استخدام [المحولات](/tag/المحولات) النادرة (Sparse [Autoencoders](/tag/autoencoders) - [SAEs](/tag/saes)) لاستعادة الخصائص المرتبطة بسلوك [النماذج](/tag/النماذج) في اتخاذ [قرارات](/tag/قرارات) الاتصال، مع تقليصها إلى هامش [تنشيط](/tag/تنشيط) مضمن وتقدير الإزاحة بشكل مباشر. أثبتت النتائج أن النموذج يكون محايدًا فقط عندما يتفوق [تنشيط](/tag/تنشيط) «عدم الاتصال» على [تنشيط](/tag/تنشيط) «الاتصال»، بما يتماشى مع فرضية IBH.
لمعالجة هذا الانحياز، تم اختبار فرضية IBH بشكل سببي باستخدام [تقنية](/tag/تقنية) [توجيه](/tag/توجيه) الهامش المعاكس (Adaptive Margin-Calibrated Steering - AMCS)، والتي توفر تعديلات فعالة على [قرار](/tag/قرار) الاتصال، مما ساهم في تقليل الإفراط في الاتصال وتحسين [الدقة](/tag/الدقة) العامة للنماذج مع انخفاض طفيف في [دقة](/tag/دقة) الاتصال.
هذا [البحث](/tag/البحث) يسلط الضوء على كيفية إعادة [تفسير](/tag/تفسير) الإفراط في الاتصال كظاهرة يمكن معالجتها من خلال خطوات ميكانيكية وعلمية. يتيح ذلك للنماذج [تحسين](/tag/تحسين) أدائها وتعزيز موثوقيتها في المستقبل.
للمهتمين بالتفاصيل التقنية، يمكنكم الاطلاع على [الكود البرمجي](/tag/[الكود](/tag/الكود)-البرمجي) المتاح على موقع [GitHub](/tag/github) [هنا](https://github.com/SKURA502/agent-sae/). فما رأيكم في هذا التطور؟ شاركونا في [التعليقات](/tag/التعليقات)!
هل تعاني نماذج الذكاء الاصطناعي من انحياز الإفراط في الاتصال؟ اكتشف الحقيقة هنا!
تكشف دراسة جديدة عن انحياز داخلي في نماذج اللغات الضخمة (LLM)، حيث تُظهر ميلًا مفرطًا لاستدعاء الأدوات حتى في الحالات غير الضرورية. تعرف على كيفية معالجة هذه المشكلة لتحسين دقة الأداء.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
