في عالم الذكاء الاصطناعي، يقدم [البحث](/tag/البحث) الجديد حول بنية [التنبؤ](/tag/التنبؤ) المشتركة (Joint-embedding predictive architectures - JEPA) طرقًا مبتكرة لتحسين [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models) - [LLMs](/tag/llms)). تستند الفكرة الرئيسية إلى ضرورة [تعلم](/tag/تعلم) [النماذج](/tag/النماذج) لتجريدات أكثر فائدة من خلال توقع التمثيلات الكامنة بدلاً من المخرجات المرصودة.
تظهر هذه [الدراسة](/tag/الدراسة) أن [تحقيق](/tag/تحقيق) [تحسينات](/tag/تحسينات) ملموسة في [الأداء](/tag/الأداء) يتطلب متطلبات صارمة؛ حيث يجب أن تصل [هندسة](/tag/هندسة) الحالة المخفية إلى رأس النموذج اللغوي، وتعزز أيضًا المقياس المتعلق بالمهمة التي يحلها النموذج. في هذه الدراسة، تم اختبار هذه المتطلبات باستخدام [نموذج Llama](/tag/[نموذج](/tag/نموذج)-llama)-3.2-1B-Instruct LoRA، حيث تمت المقارنة بين اثنين وعشرين ملحقًا تدريبيًا مختلفًا.
تمت [دراسة](/tag/دراسة) تأثير تشكيل المسار، [القيود](/tag/القيود) التوزيعية، عدم [التناسق](/tag/التناسق) بين المُتنبئ والهدف، وقياسات فيشر بواسطة الظروف ذات الصلة. على الرغم من أن بعض الملحقات حققت نتائج واعدة، إلا أنه لم ينجح أي منها في البقاء تحت الفحص الصارم (مثل Bonferroni)، مما يشير إلى أن [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) لا يزال بحاجة لمزيد من [البحث](/tag/البحث).
على الرغم من أن JEPA الحاملة للرؤية استطاعت [تحقيق](/tag/تحقيق) أول تقدير إيجابي لتمثيل مُفعل [عبر](/tag/عبر) التداخل بين المساعدة وقياسات التقاطع، فإن [الأداء](/tag/الأداء) الكلي ظل ثابتًا دون [تغييرات](/tag/تغييرات) جذرية. يتضح أن الربط بين [تمثيلات](/tag/تمثيلات) الحالة المخفية ودقة المهام المنفذة عُرضة لنقاط ضعف كبيرة، مما يدفعنا لإعادة صياغة [تقييم](/tag/تقييم) JEPA في مجالات [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) كقضية ربط.
ختامًا، يبقى السؤال: تحت أي [مقاييس](/tag/مقاييس) تصبح [الهندسة](/tag/الهندسة) المفيدة للتمثيل مرئية في [إشارات](/tag/إشارات) المهام التي يعالجها النموذج؟ كيف برأيك يمكن [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) العام لمثل هذه [النماذج](/tag/النماذج)؟
التعلم الذاتي دون مكافأة: تدقيق JEPA لتحسين نماذج اللغات الضخمة!
تقدم بنية التنبؤ المشتركة (JEPA) أفكارًا جديدة حول تحسين نماذج اللغات الضخمة (LLMs) من خلال التركيز على التمثيلات الكامنة بدلاً من المخرجات التقليدية. دراسة جديدة تكشف عن صعوبات تحقيق أداء مُحسن عبر تكييفات معقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
