في عالم الذكاء الاصطناعي، يمثل تحسين النماذج اللغوية تحديًا كبيرًا، خاصة عند الانتقال من أداء عام إلى أداء مخصص في مجالات محددة. يسمح تحسين التخصص (Supervised Fine-Tuning) بتحقيق أداء أعلى ضمن المجال المخصص، ولكنه غالبًا ما يأتي على حساب قدرات النموذج العامة.

تظهر الدراسات أن هناك فجوتين رئيسيتين تؤثران على فعالية تحسين التخصص. الأولى هي فجوة التوافق في الإشراف، حيث تختلف الأهداف في المجال عن الأسلوب والتنسيق المستخدم في استجابات النموذج الأصلية. الثانية هي فجوة الحفاظ على المسار، حيث يتم تحسين نماذج التعليم القسري (Teacher-forced Models) باستخدام رموز مستهدفة ثابتة، مما يؤدي إلى فقدان السلوك الأصلي للنموذج.

هنا تأتي تقنية RAFT (التنقية البيانية وتقنيات التقطيع التكيفية لتحسين التخصص مع تخفيف النسيان)، التي تقدم إطار عمل من مرحلتين للتغلب على هاتين الفجوتين. المرحلة الأولى تتضمن بناء إشراف متوافق مع النموذج من خلال إعادة كتابة منسقة ذاتيًا، والترشيح الدلالي، ودمج الإجابات. المرحلة الثانية تقوم بتطبيق تقنيات التقطيع الشرطي على الإجابات، حيث يوفر النموذج المدرب الأصلي أهدافًا ناعمة للمسارات الناتجة عن الطالب، مما يحافظ على السياق المفيد.

علاوة على ذلك، تقدم RAFT تقنيات جديدة مثل تقطيع الحرارة Top-K والتوازن التكيفي المستند إلى متوسط الوزن، مما يساهم في استقرار المعادلة بين الأداء في المجال والقدرة العامة.

أظهرت النتائج التجريبية أن RAFT قد حسنت دقة المجالات بنحو 23.2% مقارنةً بتقنيات التحسين التقليدية، واستعادت جزءًا من الانحدار الناتج عن تقنيات التحسين على اختبارات MS-Bench وIFEval، مع تحسينات نسبية تصل إلى 18.2% و10.2% على التوالي.

في الختام، برهنت RAFT على أنه يمكن دمج تحسين البيانات مع الحفاظ على مستوى المسار لتحقيق نتائج فعالة في تحسين التخصص وتقليل النسيان، مما يعد بمثابة خطوة كبيرة نحو مستقبل أقوى لنماذج الذكاء الاصطناعي.