تُعتبر مرافقة البشر في مجموعات أحد الأسس الحيوية لتطوير إدراك اجتماعي شبيه بالبشر لدى الروبوتات. في سياق هذا التطور، يواجه الباحثون تحديات كبيرة، حيث أن البشر عادة لا يتبعون تشكيلات ثابتة. لذا، جاءت الدراسة الجديدة كخطوة مبتكرة نحو تطوير روبوتات اجتماعية ذكية تمكّنها من التعامل مع تشكيلات بشرية متغيرة بشكل ديناميكي.

في هذه الورقة، يقترح الباحثون طريقة تكيفية لمرافقة المجموعات تعمل بناءً على نماذج الرؤية واللغة (Vision-Language Models - VLMs). تستخدم هذه الطريقة قدرات هذه النماذج في التفكير الدلالي لاستنتاج مواقع المرافقين، والحفاظ على المسافات الاجتماعية، وفهم الديناميكيات الجماعية. تبدأ العملية باكتشاف أعضاء المجموعة، ومن ثم يتم إنشاء تمثيلات بصرية لمساحة التفاعل كمُدخل للنموذج.

بعد ذلك، يتم دمج هذه البيانات مع مُتحكم Predictive Path Integral (MPPI) لضمان الاستقرار والسلامة. أظهرت التجارب المنجزة عبر خمس سيناريوهات أن الطريقة المطروحة تمكن الروبوتات من مرافقة المجموعة بشكل فعّال، حيث حققت تحسينًا بنسبة 15% في معدل النجاح وتقليلاً بنسبة 25% في معدل التصادمات مقارنةً بالأساليب السابقة. بالإضافة إلى ذلك، أظهرت دراسة المستخدمين أن سلوكيات المرافقة المُولّدة كانت تُعتبر طبيعية ومناسبة اجتماعيًا.

إن هذه النتائج تشير إلى أن استخدام تقنيات الذكاء الاصطناعي يفتح آفاقًا جديدة أمام تطوير روبوتات يمكنها التفاعل بسلاسة مع البشر، مما يعزز من إمكانيات الذكاء الاصطناعي في المجالات الاجتماعية.