في عالم الذكاء الاصطناعي، يمثل [التعليم](/tag/التعليم) المتعدد الأبعاد (Multimodal Distillation) [أداة](/tag/أداة) قوية لبناء [نماذج](/tag/نماذج) ذات [رؤية ولغة](/tag/[رؤية](/tag/رؤية)-ولغة) فعّالة ([Vision-Language Models](/tag/vision-language-models) - [VLMs](/tag/vlms)). ولكن، كما أظهرت الدراسات، فإن الاختيارات التقليدية للمحفزات المستخدمة في هذا المجال تعتمد غالبًا على [أساليب](/tag/أساليب) بسيطة أو على [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) جاهزة. هنا، تم [كشف](/tag/كشف) النقاب عن مشكلة حادة في هذا المنهج: 69% من المحفزات الموجودة في [قواعد بيانات](/tag/قواعد-[بيانات](/tag/بيانات)) [استنتاج](/tag/استنتاج) [الرسوم البيانية](/tag/الرسوم-البيانية) والوثائق تتسم بعدم وجود تغير فعلي، أي أن المعلم والطالب ينتجان نفس توزيع الإجابات.
هذا يعني أن [التدريب](/tag/التدريب) على هذه المحفزات يوفر إشارة [تعلم](/tag/تعلم) محدودة، مما يؤدي إلى وصول [تحسينات](/tag/تحسينات) الطالب إلى ذروتها بسرعة بغض النظر عن كمية [البيانات](/tag/البيانات) المستخدمة.
للتغلب على فخ الصفر ديلتا، عدنا إلى المبادئ الأساسية. يهدف [التعليم](/tag/التعليم) إلى تقليل [التباين](/tag/التباين) بين التوزيعات، وبالتالي تكون المحفزات ذات [قيمة](/tag/قيمة) فقط إذا كانت تكشف عن فجوة وظيفية بين المعلم والطالب. قمنا بتحديد هذه [الفجوة](/tag/الفجوة) من خلال [قياس](/tag/قياس) تباين الإجابات (Δ)، وأظهرنا أن وجود تباين غير صفري أمر حاسم لتحقيق توسيع فعال.
انطلاقًا من هذه الرؤية، قدّمنا [خط أنابيب](/tag/خط-أنابيب) [تصنيع](/tag/تصنيع) متدرج يعيد استخدام [مجموعات البيانات](/tag/مجموعات-[البيانات](/tag/البيانات)) الحالية لتكون بمثابة بذور، مستهدفين أنماط الفشل لدى الطالب لإنتاج [محفزات](/tag/محفزات) أفضل. كانت النتيجة هي [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) دلتا برومبتس، التي تحتوي على 200,000 مشكلة [استنتاج](/tag/استنتاج) اصطناعية ذات تباين عالٍ.
تم [تقييم](/tag/تقييم) [دلتا برومبتس](/tag/دلتا-برومبتس) [عبر](/tag/عبر) ثلاثة إعدادات مختلفة: [التعليم](/tag/التعليم) على السياسة مع الزوج المستهدف من المعلم والطالب، [النقل](/tag/النقل) إلى عائلة [نماذج جديدة](/tag/[نماذج](/tag/نماذج)-جديدة) دون إعادة إنشاء البيانات، والتهيئة خارج السياسة لنموذج غير استنتاجي. في جميع السيناريوهات، كانت [دلتا برومبتس](/tag/دلتا-برومبتس) تدفع [نحو](/tag/نحو) [تحسينات](/tag/تحسينات) ملحوظة تصل إلى 15% حتى على [نموذج](/tag/نموذج) [استنتاج](/tag/استنتاج) مُحسّن بشكل كبير مثل Qwen3-VL-8B-Thinking، وذلك خلال 10 [معايير](/tag/معايير) متنوعة تشمل [استنتاج](/tag/استنتاج) [الرسوم البيانية](/tag/الرسوم-البيانية) والوثائق واستنتاجات متعلقة بالإدراك.
دلتا برومبتس: كيف نتجاوز فخ الصفر ديلتا في تقنيات التعليم المتعدد الأبعاد
تقدم تقنية دلتا برومبتس حلاً فعالاً لفخ الصفر ديلتا في نماذج التعليم المتعدد الأبعاد، عبر تطوير مجموعة بيانات جديدة ترتكز على تحديد الفجوات الوظيفية بين المعلم والطالب. النتائج تشير إلى تحسينات ملحوظة تصل إلى 15%.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
