في زمن تتسارع فيه التطورات في مجال الذكاء الاصطناعي، يأتي إعلان ThinkSwitch ليغير قواعد اللعبة في نماذج اللغة الضخمة (Large Language Models). تعتمد هذه الطريقة الجديدة على تقنيات التحسين المتقدمة لتقليل وقت الاستجابة والتكاليف المرتبطة بحسابات التفكير. كيف تحقق ThinkSwitch ذلك؟
تعتمد ThinkSwitch على استخدام آليات تدريب مشتركة بين نقاط التفتيش (Checkpoints) المخصصة للتوجيه والتفكير. بدلاً من الحاجة إلى إجراءات حسابية معقدة لتحسين الأداء، يعتمد هذا النظام على نماذج متماثلة مثل Qwen3-4B التي تم تدريبها مسبقًا، حيث يقوم بعملية تصفية ودمج فريدة من نوعها.
تتضمن الطريقة عدة خطوات؛ إذ تبدأ كل دورة تدريبية بتوليد الإجابات من نموذج التفكير، ثم يتم إزالة أثر التفكير، ليُ distilled بشكل خاص إلى نموذج التوجيه باستخدام تقنية QLoRA (Quantized Low-Rank Adaptation). يتم بعد ذلك إعادة بناء نقطة تفتيش التفكير باستخدام طريقة التداخل الكروي (Spherical Weight Interpolation).
النتائج كانت مذهلة، حيث حققت ThinkSwitch تحسناً ملحوظاً في الأداء: في اختبار AIME 2026, ارتفع الأداء من 10/30 إلى 20/30 لنموذج التوجيه ومن 14/30 إلى 22/30 لنموذج التفكير. وعلى نفس الوتيرة، في مجموعة PubMedQA، زاد الأداء من 13/30 إلى 18/30 للتوجيه ومن 18/30 إلى 25/30 للتفكير. كما أن هذه التجارب أظهرت أن التكاليف كانت معقولة جداً، إذ تجاوزت 2.86 دولار فقط باستخدام وحدة معالجة رسومات RTX 3070.
إن النتائج، رغم كونها في نطاق صغير، تكشف عن إمكانية كبيرة لتحسين عملية التفكير المحدّد. مما يفتح آفاق جديدة في كيفية استخدام الذكاء الاصطناعي لحل مشكلات معقدة بأسلوب أكثر كفاءة ومرونة.
ثورة في الذكاء الاصطناعي: طريقة ThinkSwitch تعزز الأداء في مهام التفكير المعقدة!
تقدم ThinkSwitch نهجاً مبتكراً لتقليل التكلفة وتحسين أداء النماذج اللغوية في مهام التفكير الخاصة، مما يزيد من الكفاءة ويقلل من التعقيد الزمني. اكتشفت التجارب نتائج مثيرة تعزز أهمية هذه الطريقة في الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
