مع تزايد الاعتماد على [وكلاء الذكاء الاصطناعي](/tag/[وكلاء](/tag/وكلاء)-الذكاء-الاصطناعي) ([AI Agents](/tag/ai-agents)) في التعامل مع مهام متعددة مثل المناورة، والمحادثة، وبناء الذاكرة، أصبح من الضروري تعزيز قدرة هذه الأنظمة على التنفيذ المتوازي بكفاءة. في هذا السياق، تظهر [نماذج](/tag/نماذج) Vision-Language-Action ([VLA](/tag/vla)) المدعومة بتقنيات Mixture-of-[Transformers](/tag/transformers) (MoT) كأحد الحلول الواعدة. رغم ذلك، يواجه النظام الراهن [تحديات](/tag/تحديات) تتعلق بكفاءة [الأداء](/tag/الأداء) بسبب الازدحام والحسابات الزائدة.
لقد حدد الباحثون [إدارة](/tag/إدارة) [التخزين المؤقت](/tag/[التخزين](/tag/التخزين)-المؤقت) ([KV Cache](/tag/kv-cache) Management) كسبب رئيسي لهذه المشكلات، حيث يسهم النظام الحالي في [تخزين البيانات](/tag/[تخزين](/tag/تخزين)-[البيانات](/tag/البيانات)) بشكل غير فعال. أما OxyGen، فهو [اقتراح](/tag/اقتراح) مبتكر يتمحور حول [إدارة](/tag/إدارة) [التخزين المؤقت](/tag/[التخزين](/tag/التخزين)-المؤقت) بشكل موحد، بحيث يُعتبر موردًا مشتركًا لكافة المهام وفي أوقات مختلفة.
تُتيح هذه الفكرة عدة [تحسينات](/tag/تحسينات) رئيسية: أولاً، تسهم [مشاركة](/tag/مشاركة) [التخزين المؤقت](/tag/[التخزين](/tag/التخزين)-المؤقت) بين المهام في تجنب الاعتماد المتكرر على الملاحظات المشتركة، مما يقلل من الحاجة لعمليات [تخزين](/tag/تخزين) مكررة. وثانيًا، تعمل [تقنية](/tag/تقنية) [تجميع البيانات](/tag/تجميع-[البيانات](/tag/البيانات)) المستمر على فصل عملية [فك تشفير](/tag/[فك](/tag/فك)-[تشفير](/tag/تشفير)) [اللغة](/tag/اللغة) ذات الطول المتغير عن [توليد الأفعال](/tag/[توليد](/tag/توليد)-الأفعال) بمعدل ثابت، مما يحقق توازناً ديناميكياً أكثر [كفاءة](/tag/كفاءة).
لقد تم اختبار [OxyGen](/tag/oxygen) على [منصة](/tag/منصة) [NVIDIA](/tag/nvidia) GeForce RTX 4090 وJetson AGX Thor، حيث حقق أداءً لا يصدق بتسريع يصل إلى 3.7 ضعف بالمقارنة مع التنفيذ التقليدي، مما يسمح بتحقيق أكثر من 200 رمز في الثانية و70 هرتز لتكرار الأفعال دون التأثير على جودة [الأداء](/tag/الأداء). وتم اختبار هذا التحسن العملي أيضاً على روبوت بشري حقيقي مجهز بمنصة Jetson AGX Thor.
بهذا، فإن [OxyGen](/tag/oxygen) ليس فقط خطوة [نحو](/tag/نحو) [تحسين](/tag/تحسين) [كفاءة](/tag/كفاءة) [أنظمة](/tag/أنظمة) [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) بل يمثل نقلة نوعية في طريقة إدارتنا للموارد في [النماذج](/tag/النماذج) متعددة المهام.
OxyGen: ثورة في إدارة التخزين المؤقت للذكاء الاصطناعي متعدد المهام!
تمثل OxyGen ابتكاراً رائداً في تحسين أداء نماذج الذكاء الاصطناعي عن طريق إدارة موحدة للتخزين المؤقت، مما يعزز من سرعة التنفيذ وجودة الأداء. هذا التطور يعد بتغيير قواعد اللعبة في مهام ذكاء الاصطناعي المتعددة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
