في عالم [التكنولوجيا](/tag/التكنولوجيا) المتسارعة، تشكل [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) التي تربط بين [الرؤية](/tag/الرؤية) والصوت والحركة (Vision-Language-Action models) نقطة [تحول](/tag/تحول). على الرغم من القوة التي توفرها [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) [الرؤية](/tag/الرؤية) ([Vision-Language Models](/tag/vision-language-models)) من خلال [التدريب](/tag/التدريب) الشامل على الويب، إلا أنها قد تعاني من ضعف [الأداء](/tag/الأداء) عند [تنفيذ المهام](/tag/[تنفيذ](/tag/تنفيذ)-المهام) الروبوتية البسيطة.
هنا يأتي دور [تقنية](/tag/تقنية) **توجيه [تنشيط](/tag/تنشيط) المفاهيم المتباينة (Contrastive Conceptor Activation Steering - COAST)**، والتي تهدف إلى معالجة هذا التحدي. تعتمد COAST على فكرة "المفهوم"، وهو عامل خطي يقوم بإسقاط [البيانات](/tag/البيانات) بلطف في العناصر الأساسية لتوزيع مستهدف. من خلال استخدام هذه المفاهيم، تقوم COAST بتحديد الفضاءات الفرعية الحيوية التي تؤثر على [نجاح](/tag/نجاح) المهام الروبوتية، مستندة إلى أمثلة من [التجارب](/tag/التجارب) الناجحة والفاشلة.
عند مرحلة الاستدلال، تقوم COAST بتوجيه [تمثيلات](/tag/تمثيلات) [النماذج](/tag/النماذج) [نحو](/tag/نحو) هذه الفضاءات المستهدفة لتعزيز نتائج المهام. وقد أظهرت [الأبحاث](/tag/الأبحاث) أن استخدام COAST أدى إلى [تحسين](/tag/تحسين) معدل [نجاح](/tag/نجاح) [المحاكاة](/tag/المحاكاة) والروبوتات الحقيقية بنسبة تتجاوز 20% و40% على التوالي.
تكشف [هندسة](/tag/هندسة) الفضاءات التنشيطية أن أنماط الفشل تشترك في بنية كبيرة [عبر](/tag/عبر) المهام، بينما تظل التمثيلات الناجحة مخصصة إلى حد كبير لكل مهمة. فعندما تشترك المهام في أنماط [فشل](/tag/فشل) مماثلة، [تمكن](/tag/تمكن) هذه البنية نفس المفاهيم من [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) في مهام جديدة دون الحاجة إلى إعادة [التدريب](/tag/التدريب).
تشير نتائجنا إلى أن [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) الحالية تحتفظ بمعرفة كبيرة تتعلق بالمهام في تمثيلها الكامن، وأن مختنق [فك الرموز](/tag/[فك](/tag/فك)-الرموز) للخبير في [الحركة](/tag/الحركة) يمكن أن يتم تخفيفه من خلال [توجيه](/tag/توجيه) تدفق [البيانات](/tag/البيانات) [نحو](/tag/نحو) الفضاءات ذات الصلة بالمهام. توفر COAST مساراً خفيف الوزن وخالياً من [التدريب](/tag/التدريب) لإطلاق هذه القدرات الكامنة من خلال [توجيه النموذج](/tag/[توجيه](/tag/توجيه)-النموذج) [نحو](/tag/نحو) [توزيعات](/tag/توزيعات) خالية من النجاح الخاصة به.
إطلاق العنان لذكاء النماذج اللغوية والصورية: COAST لتحسين أداء الروبوتات!
تمثل تقنية COAST نقلة نوعية في أداء نماذج الذكاء الاصطناعي التي تربط بين الرؤية واللغة والحركة، حيث تعزز فرص نجاح الروبوتات في مهامها. تعرفوا على كيف يمكن لهذه التقنية أن تغير قواعد اللعبة في عالم الروبوتات الذكية!
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
