لطالما كانت اللغة الطبيعية وسيلة قوية للتفكير والتقييم في نماذج اللغة والرؤية-لغة، ولكن هل كانت ملائمة لاستراتيجيات التحكم المستمر؟ في دراسة مثيرة، تم تناول هذه النقطة من خلال تقديم مفهوم "التفكير المستمر" (Continuous Reasoning) كنمط جديد لتحسين أداء نماذج رؤية-لغة-عمل (VLA).

هذه النماذج تحتاج إلى اتخاذ القرارات بسرعة ودقة عالية، حيث أن خطوة تفكير واحدة قد تمتد عبر العديد من الأفعال. وهذا يحتاج إلى أسلوب مختلف، حيث يطرح التساؤل: ماذا ينبغي أن يكون دور اللغة في هذا الإطار؟

تؤكد هذه الدراسة على أهمية أن تكون وسيلة التفكير في VLA قابلة للتشارك بين نماذج متعددة، قابلة للتحقق من خلال تحسين النتائج العملية، ومتوافقة مع هيكل السيطرة الممتد زمنياً. من خلال هذا المنظور، طُرح نموذج "التفكير المستمر" الذي يمكنه التنبؤ بجملة من الأفكار المستمرة بشكل منظم، ثم يعيد استخدامها كسياق مشترك لتوليد الأفعال المهيكلة.

لكن تحسين التنبؤ بالأفعال ليس كافياً لتأكيد جودة التفكير. فإذا كانت الوسيلة الداخلية نفسها لا يمكن مشاركتها بين نماذج مختلفة، فقد تصبح مجرد اختصار خاص بالنموذج لا يدعم السيطرة العامة. لذا، فقد قام الباحثون بتطبيق التفكير المستمر على شكل واجهة Gaussian مشتركة، حيث يتم تدريبها بإطار عمل للتحقق الذاتي.

من الناحية التجريبية، أظهر "التفكير المستمر" تقدماً ملحوظاً في نظام LIBERO-PRO، حيث حقق تحسيناً بنسبة 40.4% في نجاح المهام الفرعية على نموذج TX-G2 و 26.3% على نموذج HSR. الأمر الذي يدل على أن التفكير في VLA يتعلق أكثر بلغة داخلية قابلة للتشارك والتحقق منها بدلاً من مجرد إضافة رموز.

إذا كنتم متحمسين لمعرفة كيف ستؤثر هذه التطورات على مستقبل الذكاء الاصطناعي، فنحن نود سماع آرائكم! ما هي توقعاتكم حول هذه الابتكارات في نماذج الذكاء الاصطناعي؟ شاركونا في التعليقات.