في عالم الذكاء الاصطناعي، نجد أن نماذج التفكير الضخمة (Large Reasoning Models) غالباً ما تصل إلى الحل الصحيح قبل انتهاء سلاسل التفكير الطويلة التي تتبعها. لكن، الكثير منها يستمر في التحقق المتكرر أو القيام بمحاولات غير ضرورية، مما يؤدي إلى إفساد الإجابة الصحيحة. هنا، يتدخل الابتكار الجديد الذي يُعرف باسم ROM، والذي يمثل إطار عمل رائداً لتحقيق التدخل المثمر وتحسين الأداء.
تتجلى مشكلة التشتت في نتائج النماذج، حيث تفصل التمثيلات في الطبقات العليا بين الرموز الفعالة وتلك التي تتحير في مجلد التحقق المتكرر. يقترح ROM آلية للكشف عن الحالات الخفية والتي تراقب النشاط العقلي للنموذج، مما يتيح التدخل عند الحدود المنطقية المناسبة.
عبر استخدام تقنيات التصحيح الذاتي المضاد (Counterfactual Self-Correction)، يحافظ ROM على التصحيح المفيد قبل الوصول إلى الحل الصحيح، بينما يحدد فقط الاستمرار بعد تقديم الحل كأجزاء غير ضرورية.
نتائج التجارب على مجموعات البيانات مثل MATH500 وGSM8K وAIME25 وMMLU-Pro تظهر أن ROM يعزز من دقة النماذج بشكل ملحوظ، حيث زادت دقة نموذج Qwen3-8B من 74.47% إلى 74.78%، بينما انخفض طول الاستجابة من 4262 إلى 3107 رمزاً. كذلك، النموذج DS-32B شهد زيادة في الدقة من 68.60% إلى 68.72% مع تقليل طول الاستجابة أيضاً.
يمكن القول أن ROM يعمل بسلاسة عبر مختلف النماذج، مما يدل على أنه لا يعتمد فقط على نموذج معين، بل يتشارك الحدود المفهومية لأداء النماذج المختلفة. تشير النتائج إلى أن هذه التقنية لا تعزز الدقة فحسب، بل تقلل أيضاً من الوقت المستغرق للاستجابة بنسبة تصل إلى 46.5%، مما يساعد على إنجاز المهام بشكل أكثر كفاءة.
للمزيد من المعلومات، يمكنكم زيارة [الموقع الرسمي لإطار ROM](https://github.com/SaFo-Lab/ROM). كيف تعتقد أن هذه التقنية ستؤثر على مستقبل الذكاء الاصطناعي؟ شاركونا آرائكم في التعليقات.
إزالة التشتت: تحسين سريع للتفكير عبر طرق مبتكرة لرصد وتصحيح الأخطاء!
تقدم تقنية ROM إطاراً مبتكراً لتحسين أداء نماذج التفكير المعقدة من خلال تقليل التشتت. من خلال آلية كشف متطورة، يمكن للنماذج الآن تحسين دقتها وتقليل وقت الاستجابة بشكل ملحوظ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
