في عالم الذكاء الاصطناعي، يمثل التعليم المتعدد الأبعاد (Multimodal Distillation) أداة قوية لبناء نماذج ذات رؤية ولغة فعّالة (Vision-Language Models - VLMs). ولكن، كما أظهرت الدراسات، فإن الاختيارات التقليدية للمحفزات المستخدمة في هذا المجال تعتمد غالبًا على أساليب بسيطة أو على مجموعات بيانات جاهزة. هنا، تم كشف النقاب عن مشكلة حادة في هذا المنهج: 69% من المحفزات الموجودة في قواعد بيانات استنتاج الرسوم البيانية والوثائق تتسم بعدم وجود تغير فعلي، أي أن المعلم والطالب ينتجان نفس توزيع الإجابات.
هذا يعني أن التدريب على هذه المحفزات يوفر إشارة تعلم محدودة، مما يؤدي إلى وصول تحسينات الطالب إلى ذروتها بسرعة بغض النظر عن كمية البيانات المستخدمة.
للتغلب على فخ الصفر ديلتا، عدنا إلى المبادئ الأساسية. يهدف التعليم إلى تقليل التباين بين التوزيعات، وبالتالي تكون المحفزات ذات قيمة فقط إذا كانت تكشف عن فجوة وظيفية بين المعلم والطالب. قمنا بتحديد هذه الفجوة من خلال قياس تباين الإجابات (Δ)، وأظهرنا أن وجود تباين غير صفري أمر حاسم لتحقيق توسيع فعال.
انطلاقًا من هذه الرؤية، قدّمنا خط أنابيب تصنيع متدرج يعيد استخدام مجموعات البيانات الحالية لتكون بمثابة بذور، مستهدفين أنماط الفشل لدى الطالب لإنتاج محفزات أفضل. كانت النتيجة هي مجموعة بيانات دلتا برومبتس، التي تحتوي على 200,000 مشكلة استنتاج اصطناعية ذات تباين عالٍ.
تم تقييم دلتا برومبتس عبر ثلاثة إعدادات مختلفة: التعليم على السياسة مع الزوج المستهدف من المعلم والطالب، النقل إلى عائلة نماذج جديدة دون إعادة إنشاء البيانات، والتهيئة خارج السياسة لنموذج غير استنتاجي. في جميع السيناريوهات، كانت دلتا برومبتس تدفع نحو تحسينات ملحوظة تصل إلى 15% حتى على نموذج استنتاج مُحسّن بشكل كبير مثل Qwen3-VL-8B-Thinking، وذلك خلال 10 معايير متنوعة تشمل استنتاج الرسوم البيانية والوثائق واستنتاجات متعلقة بالإدراك.
دلتا برومبتس: كيف نتجاوز فخ الصفر ديلتا في تقنيات التعليم المتعدد الأبعاد
تقدم تقنية دلتا برومبتس حلاً فعالاً لفخ الصفر ديلتا في نماذج التعليم المتعدد الأبعاد، عبر تطوير مجموعة بيانات جديدة ترتكز على تحديد الفجوات الوظيفية بين المعلم والطالب. النتائج تشير إلى تحسينات ملحوظة تصل إلى 15%.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
