في خطوة غير مسبوقة نحو تحسين كفاءة نماذج اللغات الضخمة (LLMs)، تقدم دراسة حديثة إطاراً شبه إشرافياً وله القدرة على تحسين جودة التفكير من خلال الحد الأدنى من الإشراف. يكمن الابتكار في تحويل عملية التحقق من التفكير إلى آلية لإنشاء البيانات، مما يوفر طريقة أكثر اقتصادية وفعالية لتطوير مصادر تفكير واسعة النطاق.
يعتمد الإطار الجديد على تدريب مُصنف خفيف الوزن لتقييم صحة مسارات التفكير الوسيطة التي ينتجها النموذج، وذلك باستخدام عدد قليل جداً من عينات البيانات المعنونة بشكل صحيح. وهو ما يمثل تحولاً عن الطرق التقليدية التي تحتاج إلى آلاف الإجابات المعلومة.
كما يتم ضبط عتبة الثقة المستندة إلى الشذوذ (entropy) للتخلص من العينات غير الموثوقة، بينما تُستخدم المسارات ذات الثقة العالية لتدريب النموذج وتحسين أدائه.
النتائج التجريبية التي أُجريت على مجموعة مسألة الرياضيات القابلة للتحقق (Orca-Math) وأسئلة تستند إلى رسم المشاهد (GQA) مع البرمجة المرئية أظهرت أن الطريقة الجديدة تحقق دقة مشابهة لاستخدام 10-15 مرة من البيانات المعنونة.
تعتبر هذه الطريقة بمثابة مسار عملي نحو إنشاء أنظمة تفكير ذاتي مستقبلية تتعلم من الحد الأدنى من الإدخال البشري، مما قد يغير وجه الذكاء الاصطناعي كما نعرفه الآن.
هل ترى أن هذا التطور سيحدث نقلة نوعية في كيفية تعلم الأنظمة الذكية؟ شاركنا برأيك في التعليقات!
ثورة في نماذج الذكاء الاصطناعي: إطار شبه إشرافي لتحسين التفكير مع الحد الأدنى من البيانات!
تقدم ورقة بحثية جديدة إطاراً شبه إشرافياً لتطوير نماذج لغات ضخمة (LLMs) قادر على تحسين نتائج التفكير باستخدام عدد محدود من البيانات. هذا الابتكار يعد خطوة نحو بناء أنظمة تفكير ذاتي تعتمد على إدخال إنساني محدود.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
