تعتبر [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)) من أهم التطورات في مجال الذكاء الاصطناعي، خاصةً في سيناريوهات التعليل المعقد. لكنها تواجه [تحديات](/tag/تحديات) كبيرة في تكليف الائتمانات بشكل دقيق وتوفير [مكافآت](/tag/مكافآت) موثوقة. يُعَدّ [تحسين](/tag/تحسين) [تقنيات](/tag/تقنيات) [الائتمان](/tag/الائتمان) إحدى الركائز الأساسية لتحقيق هذا الهدف.
تقدم الورقة البحثية الجديدة [AMR-SD](/tag/amr-sd) ([الاستخلاص الذاتي](/tag/الاستخلاص-الذاتي) المراوغ غير المتماثل) حلاً مبتكرًا لهذه المشاكل. في حين أن [الخوارزميات](/tag/الخوارزميات) التقليدية مثل [GRPO](/tag/grpo) تعطي [مكافآت](/tag/مكافآت) موحدة لجميع الرموز، وهو ما يتسبب في تفشي اختناق في [تخصيص](/tag/تخصيص) الائتمانات، فإن [AMR-SD](/tag/amr-sd) يتجاوز ذلك عن طريق إدخال "اختناق عاكس".
تعمل هذه [التقنية](/tag/التقنية) على تضييق [المعلومات](/tag/المعلومات) التشخيصية، مستفيدة من نتائج [التحقق](/tag/التحقق) أو ملاحظات الأقران، وتحويلها إلى تلميحات سقراطية ذات دلالة عالية. وهذا يقودنا إلى مفهوم مهم آخر، وهو "كسب [المعلومات](/tag/المعلومات) [السببية](/tag/السببية)" (Causal Information Gain)، والذي يستخدم لاستخلاص مزايا دقيقة على مستوى الرموز.
بتبني آلية [تحكم](/tag/تحكم) غير متماثلة تعتمد على الرفض العشوائي (ReLU)، تستطيع [AMR-SD](/tag/amr-sd) الاحتفاظ بالمكافآت الأساسية للبيئة مع [تقليل الضوضاء](/tag/تقليل-الضوضاء) التوزيعية التي قد تؤثر سلبًا على [الأداء](/tag/الأداء).
أجريت [تجارب](/tag/تجارب) مشابهة [عبر](/tag/عبر) [معايير](/tag/معايير) علمية ورياضية، حيث أظهرت [AMR-SD](/tag/amr-sd) أداءً متفوقًا مقارنةً بأساليب سابقة، مما أضفى عليها استقرارًا قويًا على المدى الطويل وتجنب الانهيار المتأخر في عملية [التدريب](/tag/التدريب).
إذا كنت من المهتمين بمجال الذكاء الاصطناعي، فإن [تقنية](/tag/تقنية) [AMR-SD](/tag/amr-sd) تعد إنجازاً يُستحسن متابعته، حيث تمثل خطوة واسعة [نحو](/tag/نحو) [تطوير](/tag/تطوير) [نماذج لغة](/tag/[نماذج](/tag/نماذج)-[لغة](/tag/لغة)) أكثر فعالية ودقة.
AMR-SD: تقنيات جديدة في تحسين نماذج اللغة عبر الاستخلاص الذاتي المراوغ!
تقدم تقنية AMR-SD حلولاً مبتكرة لتعزيز أداء نماذج اللغة الكبيرة (LLMs) في التعليل المعقد، مستخدمة آلية الاستخلاص الذاتي المراوغ. هذه الطريقة تتجاوز العقبات التقليدية في تخصيص الائتمانات وتعزز الاستقرار على المدى الطويل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
