في عصر تتزايد فيه وتيرة الابتكارات في عالم الذكاء الاصطناعي، تبرز نماذج اللغات الضخمة (LLMs) كأحد أبرز الأدوات التي تحقق نجاحات باهرة في مجالات متعددة، خاصة في مهام اتخاذ القرار طويل الأمد. ومع ذلك، تواجه هذه النماذج تحديات كبيرة عندما يتعلق الأمر بتكاليف الاستدلال المرتفعة نتيجة لاستخدام نماذج أكبر وأقوى.

ولحل هذه الإشكالية، تقدم الباحثون تقنية جديدة تُعرف بتوجيه ديناميكي بدقة مختلطة (Dynamic Mixed-Precision Routing - DMR) وذلك لتحسين فعالية التفاعل متعدد الخطوات مع نماذج اللغات الضخمة. يعتمد هذا النظام على مبدأ التنوع في الحساسية بين خطوات التفاعل، حيث يقوم بتكييف مستوى الدقة بين نماذج عالية الدقة وأخرى ذات دقة منخفضة، مما يسمح بتحسين الكفاءة والتقليل من التكاليف.

يتكون إطار عمل DMR من مرحلتين رئيسيتين: الأولى تعتمد على التعلم المشرف المستند إلى تباين KL، التي تهدف إلى تحديد الخطوات الحساسة للدقة، تليها استخدام تحسين السياسات النسبي الجماعي (Group-Relative Policy Optimization - GRPO) لتحسين معدلات النجاح في المهام.

أظهرت النتائج التجريبية على منصات مثل ALFWorld وWebShop أن هذه المقاربة تضمن تحقيق توازن قوي بين الدقة والتكلفة مقارنةً بأساليب استخدام الدقة الفردية، مما يمثل خطوة كبيرة نحو تحسين الأداء في مشروعات الذكاء الاصطناعي المستقبلية.

هل تعتقد أن توجيه ديناميكي بدقة مختلطة يمكن أن يشكل الفارق في مجالات أخرى بالتفاعل مع نماذج الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!