تظهر نماذج اللغات الضخمة (Large Language Models) قدرات مذهلة في اتخاذ القرارات من خلال دمج التفكير والعمل، كما هو موضح في أطر عمل رياكت (ReAct). ومع ذلك، فإن التحديات التي تصاحب نشر هذه النماذج عمليًا تتلخص في تكاليف الاستدلال العالية وأحجام النماذج الكبيرة.
في خطوة جديدة ومميزة، يطرح الباحثون تقنية تصفية الوكيل الهيكلية (Structured Agent Distillation)، التي تهدف إلى ضغط هذه الوكلاء المعتمدة على نماذج اللغات الضخمة إلى نماذج أصغر، تُعرف بالنماذج الطلابية، مع الحفاظ على دقة التفكير وتناسق الأفعال. بدلاً من الأساليب القياسية التي تعتمد على تغذية نماذج اللغات بحروف فردية، تقسم طريقتنا المسارات إلى قسمين أساسيين: [التفكير] ([REASON]) و[الفعل] ([ACT])، مما يتيح تطبيق خسائر خاصة بكل قسم لضبط سلوك النماذج الطلابية لتتوافق بشكل أفضل مع قرارات المعلم.
تُظهر التجارب التي تم إجراؤها على منصات مثل ALFWorld وHotPotQA-ReAct وWebShop أن هذا الأسلوب يتفوق بشكل مستمر على الأساليب التقليدية، محققًا ضغطًا كبيرًا مع انخفاض طفيف في الأداء. كما تسلط نتائج التحجيم والتجارب الضوء على أهمية تماهي العناصر المذكورة للحصول على وكلاء أكثر كفاءة وقابلية للتطبيق.
ما رأيكم في هذه التقنية الحديثة؟ هل تعتقدون أنها ستغيّر مسار تطوير الذكاء الاصطناعي في المستقبل؟ شاركونا آراكم في التعليقات.
ثورة في تقنيات الذكاء الاصطناعي: تقنيات تصفية الوكيل الهيكلية لنماذج اللغات الضخمة
تقدم تقنيات تصفية الوكيل الهيكلية نهجًا مبتكرًا لضغط نماذج الذكاء الاصطناعي، مما يعزز من كفاءتها وجودتها. هذه التقنية تشير إلى مستقبل أكثر كفاءة في مجال نماذج اللغات الضخمة (LLMs).
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
