في عالم الذكاء الاصطناعي، تُعتبر نماذج التوليد الذاتي البصري (Autoregressive Models) واحدة من الابتكارات المذهلة، لكن النموذج التقليدي الذي يعتمد على التنبؤ بالخطوة التالية غالباً ما يعاني من تأخير في عملية الاستدلال. بينما أثبت التشفير الاستكشافي (Speculative Decoding) فعاليته في تسريع عمل هذه النماذج، إلا أن طريقة "خطوة إعداد، ثم تحقق" تعيق القدرة على تقليل عدد المرور الأمامي بشكل مباشر وتحد من سرعة الإجراءات.
مؤخراً، ارتأى الباحثون استكشاف مفهوم تخطي التحقق في عملية التشفير الاستكشافي، مما يعد خطوة جديدة في هذا المجال. تم تحليل خصائص مرحلة الإعداد، حيث وُجد أن تكرار التحقق وإمكانية إعادة استخدام الميزات القديمة هي عوامل رئيسية للحفاظ على جودة التوليد، بينما تُحسن السرعة للخطوات التي لا تحتاج إلى تحقق.
بناءً على هذه الملاحظات، تم اقتراح إطار عمل ثوري باسم VVS، الذي يسعى لتسريع نماذج التوليد الذاتي البصري من خلال تخطي بعض خطوات التحقق. يتضمن VVS ثلاثة وحدات تكاملية:
1. مُختار رموز غير مُتحقق منها مع تقصير ديناميكي.
2. تخزين الميزات على مستوى الرموز وإعادة استخدامها.
3. جدولة دقيقة للخطوات المُتخطاة.
وبذلك، تمكن نظام VVS من تقليل عدد المرور الأمامي للنموذج بنحو 2.8 مرة مقارنةً بالتشفير الذاتي الاعتيادي، دون التأثير على جودة التوليد، مما يقدم توازنًا مثيرًا بين السرعة والجودة.
هذه التقنية ليست مجرد تحديث بسيط، بل تفتح آفاقًا جديدة لإعادة تشكيل مفهوم التشفير الاستكشافي وتطبيقاته المستقبلية في مجال الذكاء الاصطناعي. يمكن الاطلاع على الشيفرة البرمجية الخاصة بهذا الابتكار من خلال [رابطهم هنا](https://github.com/HyattDD/VVS).
زيادة سرعة توليد الصور: تقنية VVS تعيد تشكيل مفهوم التشفير الاستكشافي
تتطلع تقنية VVS لتحسين سرعة نموذج التوليد الذاتي البصري من خلال تخطي بعض خطوات التحقق، مما يخفض وقت الاستجابة دون التأثير على جودة الصور المنتجة. النتائج تشير إلى قفزات نوعية في الأداء، مما يفتح آفاقاً جديدة في هذا المجال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
