أثبتت الأبحاث الجديدة في مجال التعلم الآلي أن استخدام استراتيجيات فعالة يؤدي إلى تقليل الإفراط في التكيف (overfitting)، وهو ما يمثل تحدياً كبيراً في هذا المجال. تم تحليل هذا الأمر في سياق وكالات البحث المعتمدة على نماذج اللغات الضخمة (Large Language Models)، حيث تم طرح فرضية مثيرة للاهتمام: هل يمكن أن تكون الاستراتيجيات الناجحة قابلة للإرسال بشكل عالي؟

في هذه الدراسة، تم استخدام نوعين من نقاط الاختناق المعلوماتية: "ضغط المخرجات" و"ضغط المدخلات". حيث يقوم وكيل الاستكشاف بالبحث بشكل تفاعلي عن نماذج عالية الأداء باستخدام مجموعة التحقق، ومن ثم تم اختبار ما إذا كان بإمكان وكيل إعادة الإنتاج الجديد إعادة إنتاج الأداء المتميز باستخدام مجرد موجه قصير للغاية والبيانات التدريبية.

بالإضافة إلى ذلك، في "ضغط المدخلات"، تلقى الوكيل تعليقات بسيطة حول ما إذا كان النموذج المقدم يحسن من الأداء العام. تمت الدراستان عبر 8 مجموعات بيانات متنوعة، بما في ذلك تصنيف البيانات، ورؤية الكمبيوتر، ونماذج اللغة، ونماذج الانتشار، ونماذج المكافآت. نتائج البحث كانت مثيرة للإعجاب، حيث أظهرت أن هذه الاختناقات لم تؤثر كثيراً على الأداء: فالموجهات القصيرة والتعليقات القابلة للضغط كانت كافية لإعادة إنتاج وإيجاد نماذج عالية الأداء.

المثير في الأمر أن هذه الفرضية قابلة للتفنيد، حيث عند إدخال الإفراط في التكيف عمداً في مجموعة التحقق، فشلت النتائج في إعادة إنتاج الأداء باستخدام الموجهات القصيرة. الإجمال، تدعم نتائج الدراسة تفسيرية تتعلق بطول الوصف لغياب الإفراط في التكيف في التعلم الآلي المعتمد على المعيار، مما يبرز أن الاستراتيجيات الفعالة تحتل منطقة قليلة التعقيد داخل فضاء الاستراتيجيات.