في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغة الكبيرة (Large Language Models - LLMs) من الركائز الأساسية التي تدفع الابتكار والإنتاجية في العديد من المجالات. ومع ذلك، فإن التحديات المرتبطة بالذاكرة والأداء قد تقيد نشر هذه النماذج الكبيرة. هنا تأتي تقنية SHAPE الجديدة، التي تقدم حلاً يركز على التعاون بين الخبراء.

تُعالج تقنية SHAPE نماذج مزيج الخبراء (Mixture-of-Experts - MoE) التي تعاني من مشاكل في الذاكرة. على الرغم من جودة هذه النماذج، إلا أن الذاكرة تُعتبر عائقاً رئيسياً في استخدامها. يعتمد SHAPE على إعادة تشكيل مفهوم تحجيم الخبراء بجعلها أكثر تعاوناً، حيث تقيم الخبراء بناءً على تفاعلهم مع بعضهم البعض بدلاً من تصنيف كل خبير على حدة.

تستخدم SHAPE أسلوباً يعتمد على نظرية الألعاب التعاونية لتحديد الخبراء الأساسيين الذين يسهمون بشكل فعّال في تحسين الأداء. من خلال نموذج مبني على مجموعة بيانات صغيرة، يتم تحديد القيمة التفاعلية لكل خبير في الطبقات المختلفة، مما يمكن من الحفاظ على الأدوات الأساسية لتشكيل فريق قوي من الخبراء.

أظهرت التجارب التي أُجريت على عدة نماذج ماكسيكية متقدمة مثل Qwen3-30B-A3B و GPT-OSS-20B، أن SHAPE ليس فقط يحسن الدقة ولكن أيضاً يقلل من استهلاك الذاكرة بنفس الوقت. الدراسات أثبتت قدرته على تحقيق دقة تنافسية حتى عند خفض عدد الخبراء بنسبة تصل إلى 40%.

تعتبر SHAPE خطوة مهمة نحو عالم أكثر كفاءة في استخدام موارد الذكاء الاصطناعي، ما يجعل منها إضافة رائعة للمجتمع الأكاديمي والصناعي سواء بسواء. يمكن العثور على الشفرة المفتوحة المصدر لتقنية SHAPE على GitHub.

ما رأيكم في هذا التطور المثير في عالم الذكاء الاصطناعي؟ شاركونا بأفكاركم في التعليقات!