في عالم الذكاء الاصطناعي، تمثل نماذج اللغة المتطفلة (Diffusion Language Models - dLLMs) أحد أبرز الابتكارات المتقدمة، حيث تتمكن هذه النماذج من توليد نصوص بطريقة مبتكرة من خلال عملية إزالة الضوضاء بشكل تدريجي من عدة مواضع توكنات بطريقة متوازية. ورغم جاذبية هذا الأسلوب، إلا أن التحديات في تطبيقه على أرض الواقع تكمن في توازن حجم الكتل المستخدمة أثناء عملية الاستدلال.

وبينما توفر الكتل الصغيرة الحفاظ على الشرط المحلي، فإنها تتطلب عددًا كبيرًا من خطوات إزالة الضوضاء، أما الكتل الكبيرة فقد تمنح المزيد من التوازي لكنها تتعرض لمخاطر اتخاذ قرارات مبكرة. ومع وجود تقنيات تسريع مختلفة، يعتمد معظمها على حجم كتلة واحدة لكل طلب، مما يحرمنا من فوائد تكامل أحجام الكتل المختلفة.

لذا، يأتي الإطار الحديث BlockBatch ليقدم حلا مبتكرًا، حيث يعمل على استخدام أحجام كتل متعددة لنفس الطلب من خلال تنفيذها في عملية تمرير مجمعة. يعتمد BlockBatch على دمج توكنات مدعومة بالثقة، وتنسيق يعتمد على القائد، وتجديد دوري للتسلسلات الكاملة، مما يعزز من تحديثات الكتل المحلية بمعلومات من الحالة globale لكاش (KV-cache).

وقد أظهرت التجارب التي شملت ثلاثة نماذج dLLMs وأربعة مجموعات بيانات، أن BlockBatch يقلل من عدد خطوات إزالة الضوضاء بنسبة 26.6% في المتوسط، كما يحقق سرعة معالجة تصل إلى 1.33 مرة أسرع مقارنة بتقنية Fast-dLLM، مع الحفاظ على دقة النتائج.

تُظهر هذه النتائج أن التنوع في أحجام الكتل يمثل محورًا عمليًا وغير مستكشف سابقًا لتحسين أداء نماذج اللغة المتطفلة من خلال توازي الفروع.