في عالم الذكاء الاصطناعي، يمثل [التعليم](/tag/التعليم) المتعدد الأبعاد (Multimodal Distillation) [أداة](/tag/أداة) قوية لبناء [نماذج](/tag/نماذج) ذات [رؤية ولغة](/tag/[رؤية](/tag/رؤية)-ولغة) فعّالة ([Vision-Language Models](/tag/vision-language-models) - [VLMs](/tag/vlms)). ولكن، كما أظهرت الدراسات، فإن الاختيارات التقليدية للمحفزات المستخدمة في هذا المجال تعتمد غالبًا على [أساليب](/tag/أساليب) بسيطة أو على [مجموعات بيانات](/tag/مجموعات-[بيانات](/tag/بيانات)) جاهزة. هنا، تم [كشف](/tag/كشف) النقاب عن مشكلة حادة في هذا المنهج: 69% من المحفزات الموجودة في [قواعد بيانات](/tag/قواعد-[بيانات](/tag/بيانات)) [استنتاج](/tag/استنتاج) [الرسوم البيانية](/tag/الرسوم-البيانية) والوثائق تتسم بعدم وجود تغير فعلي، أي أن المعلم والطالب ينتجان نفس توزيع الإجابات.

هذا يعني أن [التدريب](/tag/التدريب) على هذه المحفزات يوفر إشارة [تعلم](/tag/تعلم) محدودة، مما يؤدي إلى وصول [تحسينات](/tag/تحسينات) الطالب إلى ذروتها بسرعة بغض النظر عن كمية [البيانات](/tag/البيانات) المستخدمة.

للتغلب على فخ الصفر ديلتا، عدنا إلى المبادئ الأساسية. يهدف [التعليم](/tag/التعليم) إلى تقليل [التباين](/tag/التباين) بين التوزيعات، وبالتالي تكون المحفزات ذات [قيمة](/tag/قيمة) فقط إذا كانت تكشف عن فجوة وظيفية بين المعلم والطالب. قمنا بتحديد هذه [الفجوة](/tag/الفجوة) من خلال [قياس](/tag/قياس) تباين الإجابات (Δ)، وأظهرنا أن وجود تباين غير صفري أمر حاسم لتحقيق توسيع فعال.

انطلاقًا من هذه الرؤية، قدّمنا [خط أنابيب](/tag/خط-أنابيب) [تصنيع](/tag/تصنيع) متدرج يعيد استخدام [مجموعات البيانات](/tag/مجموعات-[البيانات](/tag/البيانات)) الحالية لتكون بمثابة بذور، مستهدفين أنماط الفشل لدى الطالب لإنتاج [محفزات](/tag/محفزات) أفضل. كانت النتيجة هي [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) دلتا برومبتس، التي تحتوي على 200,000 مشكلة [استنتاج](/tag/استنتاج) اصطناعية ذات تباين عالٍ.

تم [تقييم](/tag/تقييم) [دلتا برومبتس](/tag/دلتا-برومبتس) [عبر](/tag/عبر) ثلاثة إعدادات مختلفة: [التعليم](/tag/التعليم) على السياسة مع الزوج المستهدف من المعلم والطالب، [النقل](/tag/النقل) إلى عائلة [نماذج جديدة](/tag/[نماذج](/tag/نماذج)-جديدة) دون إعادة إنشاء البيانات، والتهيئة خارج السياسة لنموذج غير استنتاجي. في جميع السيناريوهات، كانت [دلتا برومبتس](/tag/دلتا-برومبتس) تدفع [نحو](/tag/نحو) [تحسينات](/tag/تحسينات) ملحوظة تصل إلى 15% حتى على [نموذج](/tag/نموذج) [استنتاج](/tag/استنتاج) مُحسّن بشكل كبير مثل Qwen3-VL-8B-Thinking، وذلك خلال 10 [معايير](/tag/معايير) متنوعة تشمل [استنتاج](/tag/استنتاج) [الرسوم البيانية](/tag/الرسوم-البيانية) والوثائق واستنتاجات متعلقة بالإدراك.