في عالم الذكاء الاصطناعي، تعتمد فعالية نماذج اللغات الضخمة (LLMs) بشكل كبير على مدى ملاءمة بيانات التدريب للمهام التي تُقيّم عليها. لكن ما الذي يحدث عندما تكون هذه البيانات غير معروفة، كما هو الحال في المحادثات المغلقة التي تتم بين النموذج والمستخدم؟ هذا هو المحور الذي تركز عليه الأبحاث الحديثة، وعلى رأسها تقنية DUET.
تقدم DUET نهجًا مبتكرًا لتحسين بيانات التدريب من خلال التفاعل مع نتائج مهام التقييم غير المرئية. في هذه العملية، يتم استخدام عملية تجميع التغذية الراجعة من أداء النموذج على المهام غير المعروفة لتحسين مزيج البيانات. لا يعتمد هذا النهج فقط على البيانات المعروفة، بل يغمر نفسه في الأداء الفعلي للنموذج لجمع ردود الفعل والدروس المستفادة.
الأسلوب الذي تتبعه DUET هو خوارزمية جديدة تأخذ في الاعتبار التأثيرات الناتجة عن البيانات (influence function) كوسيلة لاختيار البيانات، وتقوم بدمجها مع التحسين البايزي (Bayesian optimization) لتطوير مزيج بيانات مثالي استنادًا إلى التغذية الراجعة.
وقد أظهرت التجارب التي أُجريت في مجموعة متنوعة من المهام اللغوية أن DUET تتفوق على الطرق التقليدية في اختيار البيانات، حيث تثبت أن بإمكانها تحسين الأداء حتى دون أي معرفة مسبقة بالبيانات المطلوبة لمهمة معينة.
إذا كنت من المتحمسين لتطورات الذكاء الاصطناعي، فلا شك أن DUET تمثل خطوة كبيرة نحو تحقيق أداء أفضل لنماذج الذكاء الاصطناعي في بيئات غامضة. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
DUET: ابتكار جديد لتحسين بيانات التدريب عبر التغذية الراجعة من مهام التقييم غير المرئية!
تمثل تقنية DUET ثورة في كيفية تحسين بيانات التدريب لنماذج اللغات الضخمة (LLMs) باستخدام تغذية راجعة من مهام التقييم التي لم تُرَ من قبل. أظهرت التجارب أن DUET تتفوق على الطرق التقليدية لتحسين البيانات في هذه البيئة غير المعروفة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
