في إطار التطورات المستمرة لعالم الذكاء الاصطناعي، نأتيكم بأخبار جديدة تحمل في طياتها رؤية جديدة لمشكلة ضغط السياق في نماذج اللغة الكبيرة (Large Language Models). أطلق الباحثون تقنية جديدة تُعرف باسم ACON، وهي اختصارات لعبارة "تحسين سياق الوكيل"، والتي تهدف إلى التغلب على التحديات المرتبطة بالنمو غير المحدود للسياق في المهام الطويلة الأمد.
ارتكاز النجاح في استخدام الوكلاء في البيئات الديناميكية يعتمد بصورة كبيرة على دقة تسجيل الأفعال والملاحظات. ومع ذلك، فإن النمو المتزايد للسياق في هذه المهام الطويلة يؤدي إلى تحديين رئيسيين: تكاليف الذاكرة المرتفعة أثناء الاستنتاج وتدهور القدرة على التفكير نتيجة المعلومات غير ذات الصلة. وللأسف، لم تكن طرق الضغط الحالية فعالة بالقدر الكافي، إذ غالبًا ما تعتمد على هياكل ضعيفة أو تتطلب تحديثات للمعلمات غير عملية.
تقدم ACON إطار عمل موحد يهدف إلى ضغط كل من الملاحظات والتاريخ إلى تمثيلات مختصرة ومفيدة. وبخلاف الأعمال السابقة، تعتمد ACON على تحسين الفضاء اللغوي، حيث تكرر تعديل إرشادات الضغط بناءً على تحليل الفشل للوكيل، مما يضمن الحفاظ على المعلومات الحيوية دون الحاجة إلى تعديل النموذج.
علاوة على ذلك، لتقليل العبء الحاسوبي، تم تقطير الضاغط الأمثل إلى نماذج أصغر. وقد أظهرت التجارب على منصات مثل AppWorld وOfficeBench وMulti-objective QA أن ACON قللت من استخدام الرموز بنسبة تتراوح بين 26-54% مع تحسين النجاح في المهام مقارنةً بأساليب الضغط الحالية.
المثير في الأمر، أن ACON تمكن النماذج الأصغر من العمل بفعالية كوكيل طويل الأمد، حيث تحقق تحسينًا بمعدل يصل إلى 46% من الأداء عن طريق تقليل تشتيت السياق. للمزيد من التفاصيل، يمكنكم الاطلاع على كود المصدر المتاح على رابط GitHub.
ما رأيكم في هذه التقنية الجديدة؟ هل تظنون أنها ستحسن من أداء الوكلاء في مجالات أخرى؟ شاركونا في التعليقات.
ثورة في نماذج اللغة: ACON تحل مشكلة ضغط السياق لوكلاء الذكاء الاصطناعي
تمثل ACON خطوة رائدة في تحسين ضغط السياق لوكلاء نماذج اللغة الطويلة، مما يحقق أداءً محسناً وتكاليف ذكاء اصطناعي منخفضة. تعزز هذه التقنية الجديدة من كفاءة وكالات الذكاء الاصطناعي في بيئات العالم الحقيقي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
