في عالم الذكاء الاصطناعي، تتزايد التحديات المتعلقة بتقنيات التفكير الكامن (Latent Reasoning) وكيفية تحسينها. في السنوات الأخيرة، تم اتخاذ خطوات هامة لنقل عمليات التفكير الوسيطة من الآثار اللغوية الطبيعية إلى تمثيلات كامن أو على مستوى التخزين لتحسين الأداء وتقليل العبء الناتج عن النصوص. ومع ذلك، أدى هذا التحول إلى فقدان مزية رئيسية، وهي القدرة على فحص الحالات الوسيطة، مما يجعل من الصعب تحديد ما إذا كانت الحالة الكامنة تحتفظ بالقيود المطلوبة من الاستفسار الأصلي.
إليك هنا تأتي تقنية ReLAT (Reconstruction-Guided Latent Reasoning At Test Time)، وهي طريقة تدريب ذاتي مشرف تهدف إلى سد هذه الحلقة المفقودة باستخدام الاستفسار نفسه كمرجع. وتحقيقًا لهذه الغاية، نستند في اقترابنا إلى مبدأ أساسي يقضي أنه إذا كانت حالة كامنة تمثل الاستفسار بأمانة، فلن يتمكن الاستفسار من استعادته. إذا كان الاستفسار غير قابل للاسترجاع، فإن الحالة الكامنة فقدت معلومات ذات صلة بالمهمة.
تعمل ReLAT من خلال بناء دورة متمايزة من "السؤال -> الفكرة الكامنة -> السؤال" وتحسين فقدان الاسترجاع من الاستفسار عبر الفكرة الكامنة قبل توليد الإجابة. هذا يربط عمليات الحساب الكامنة الغامضة بمواصفات المشكلة التي ينبغي أن تمثلها.
عبر اختبارات الأداء في مجالات مثل التفكير الرياضي، واسترجاع المعرفة، وتوليد الشفرات، أظهرت ReLAT تحسنًا مستمرًا مقارنة بالنمذجة الفردية، والتعاون القائم على النص، والتعاون الكامن في حلقة مفتوحة. في اختبار Qwen3-8B، ارتفعت دقة AIME 2024 من 56.7% إلى 73.3%، وهو ما يمثل زيادة قدرها 16.6 نقطة مقارنة بأقوى النماذج المتاحة في حلقة مفتوحة. إن هذه النتائج تعيد تعريف كيف يمكن للنماذج أن تستفيد من البيانات بطرق جديدة ومثيرة.
إن تقنيات مثل ReLAT قد تغير قواعد اللعبة في ساحة الذكاء الاصطناعي. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
إغلاق الحلقة في التفكير الكامن: ثورة في إعادة البناء خلال وقت الاختبار!
تمثل تقنية ReLAT قفزة نوعية في طريقة معالجة النماذج اللغوية، حيث تعيد بناء المعلومات المفقودة خلال مرحلة التفكير الكامن. تتيح هذه الطريقة تحسين الدقة بنسبة 16.6 نقطة في اختبارات الأداء، مما يعيد تعريف طريقة الاستفادة من بيانات الاستفسارات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
