مع تزايد الاعتماد على وكلاء الذكاء الاصطناعي (AI Agents) في التعامل مع مهام متعددة مثل المناورة، والمحادثة، وبناء الذاكرة، أصبح من الضروري تعزيز قدرة هذه الأنظمة على التنفيذ المتوازي بكفاءة. في هذا السياق، تظهر نماذج Vision-Language-Action (VLA) المدعومة بتقنيات Mixture-of-Transformers (MoT) كأحد الحلول الواعدة. رغم ذلك، يواجه النظام الراهن تحديات تتعلق بكفاءة الأداء بسبب الازدحام والحسابات الزائدة.
لقد حدد الباحثون إدارة التخزين المؤقت (KV Cache Management) كسبب رئيسي لهذه المشكلات، حيث يسهم النظام الحالي في تخزين البيانات بشكل غير فعال. أما OxyGen، فهو اقتراح مبتكر يتمحور حول إدارة التخزين المؤقت بشكل موحد، بحيث يُعتبر موردًا مشتركًا لكافة المهام وفي أوقات مختلفة.
تُتيح هذه الفكرة عدة تحسينات رئيسية: أولاً، تسهم مشاركة التخزين المؤقت بين المهام في تجنب الاعتماد المتكرر على الملاحظات المشتركة، مما يقلل من الحاجة لعمليات تخزين مكررة. وثانيًا، تعمل تقنية تجميع البيانات المستمر على فصل عملية فك تشفير اللغة ذات الطول المتغير عن توليد الأفعال بمعدل ثابت، مما يحقق توازناً ديناميكياً أكثر كفاءة.
لقد تم اختبار OxyGen على منصة NVIDIA GeForce RTX 4090 وJetson AGX Thor، حيث حقق أداءً لا يصدق بتسريع يصل إلى 3.7 ضعف بالمقارنة مع التنفيذ التقليدي، مما يسمح بتحقيق أكثر من 200 رمز في الثانية و70 هرتز لتكرار الأفعال دون التأثير على جودة الأداء. وتم اختبار هذا التحسن العملي أيضاً على روبوت بشري حقيقي مجهز بمنصة Jetson AGX Thor.
بهذا، فإن OxyGen ليس فقط خطوة نحو تحسين كفاءة أنظمة الذكاء الاصطناعي بل يمثل نقلة نوعية في طريقة إدارتنا للموارد في النماذج متعددة المهام.
OxyGen: ثورة في إدارة التخزين المؤقت للذكاء الاصطناعي متعدد المهام!
تمثل OxyGen ابتكاراً رائداً في تحسين أداء نماذج الذكاء الاصطناعي عن طريق إدارة موحدة للتخزين المؤقت، مما يعزز من سرعة التنفيذ وجودة الأداء. هذا التطور يعد بتغيير قواعد اللعبة في مهام ذكاء الاصطناعي المتعددة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
