AtManRL: تقنية جديدة لتعزيز التفكير المنطقي عبر الانتباه الفعال
🔬 أبحاث1 دقائق للقراءة👁 0 مشاهدة

AtManRL: تقنية جديدة لتعزيز التفكير المنطقي عبر الانتباه الفعال

تقدم AtManRL طريقة مبتكرة لتعزيز التفكير المنطقي في نماذج اللغة، باستخدام أسلوب جديد يضمن تتبع تفكير فعال ومؤثر. هذا مما يزيد من فهم نماذج الذكاء الاصطناعي لطبيعة إجاباتها.

في عالم الذكاء الاصطناعي، أضحت نماذج اللغة الضخمة (Large Language Models) تعتمد بشكل متزايد على أسلوب التفكير المتسلسل (Chain-of-Thought) لحل المهام المعقدة. وعلى الرغم من ذلك، لا يزال تحدي التأكد من أن تفكير النموذج يعكس بدقة العمليات الكامنة خلف الإجابات النهائية أمراً صعباً. ولذلك، يقدم فريق البحث تقنية جديدة تُعرف باسم AtManRL، وهي طريقة تتيح التعلم من خلال التلاعب القابل للاشتقاق في الانتباه بهدف تعزيز التفكير المنطقي.

تعتمد AtManRL على تدريب قناع انتباه إضافي يقوم بتحديد الرموز في سلسلة التفكير الضرورية لإنتاج الإجابات الصحيحة. من خلال ذلك، نشتق إشارة مكافأة الانتباه التي تحث النموذج على توليد تتبع تفكير يؤثر حقًا على توقعاته النهائية.

بوصفها طريقة مبتكرة، يتم دمج مكافأة الانتباه هذه مع المكافآت المستندة إلى النتائج داخل إطار عمل GRPO، مما يساهم في تحسين التصحيح والشفافية.

أظهرت التجارب على مجموعتين من البيانات هما GSM8K وMMLU باستخدام نموذج Llama-3.2-3B-Instruct أن منهجنا يمكنه التعرف على الرموز المؤثرة في سلسلة التفكير، مما يمكّن من تدريب نماذج تفكير أكثر شفافية ووضوحاً. هذه التقنية تمثل قفزة نوعية في كيفية فهمنا للذكاء الاصطناعي وكيفية استجابته للمهام المعقدة.
المصدر:أركايف للذكاءاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة