تسعى [التكنولوجيا الحديثة](/tag/[التكنولوجيا](/tag/التكنولوجيا)-الحديثة) إلى [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) واتخاذ القرارات بدقة أكبر في مجال الروبوتات، حيث تختبر [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) ([Vision-Language Models](/tag/vision-language-models)) حدود [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي). لكن، مع تقدم هذه النماذج، ظهرت [تحديات جديدة](/tag/[تحديات](/tag/تحديات)-جديدة) تتعلق بالموثوقية، وخاصة [الهلوسة](/tag/الهلوسة) - تلك [الأخطاء](/tag/الأخطاء) التي تؤدي إلى [استنتاجات](/tag/استنتاجات) خاطئة.
لتجاوز هذه العقبة، تم تقديم إطار [التفكير](/tag/التفكير) المُوجه بلغة الشيفرة (Pseudocode-guided Structured Reasoning) المعروف اختصارًا ب(PStar). يعمل هذا النظام من خلال اختيار مسارات [تفكير](/tag/تفكير) مُنظمة تستند إلى الشيفرات الوهمية، مما يمكن [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) من القيام بعمليات [تفكير](/tag/تفكير) مرنة ومُنظمة.
لقد شمل هذا الإطار [تصميم](/tag/تصميم) مجموعة من [وظائف](/tag/وظائف) [التفكير](/tag/التفكير) المجردة وتطوير مكتبة شيفرة مُنظمة تمثل [استراتيجيات](/tag/استراتيجيات) [تفكير](/tag/تفكير) قابلة للتعديل. وأحد [الابتكارات](/tag/الابتكارات) في هذا النظام هو [تصميم](/tag/تصميم) متجه [خصائص](/tag/خصائص) [الصعوبة](/tag/الصعوبة) (Difficulty Feature Vector) الذي يُتيح للنموذج [تقييم](/tag/تقييم) تعقيد الأسئلة وبالتالي اختيار [استراتيجيات](/tag/استراتيجيات) [تفكير](/tag/تفكير) مناسبة.
تكشف [التجارب](/tag/التجارب) الشاملة أن PStar قد [تمكن](/tag/تمكن) من تقليل معدلات [الهلوسة](/tag/الهلوسة) بشكل كبير، محققًا درجات تاريخية تبلغ 87.1% على [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) POPE و68.0% على MMStar، متفوقًا بذلك حتى على [نماذج](/tag/نماذج) مثل [GPT-4V](/tag/gpt-4v). من خلال توفير آلية موثوقة لتقليل [الأخطاء](/tag/الأخطاء) في [تفاعل](/tag/تفاعل) [الرؤية](/tag/الرؤية) واللغة، يمثل PStar خطوة حاسمة [نحو](/tag/نحو) [تحويل](/tag/تحويل) [نماذج [الرؤية](/tag/الرؤية) واللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-واللغة) إلى [أنظمة آلية](/tag/[أنظمة](/tag/أنظمة)-آلية) أكثر أمانًا وموثوقية في [التطبيقات](/tag/التطبيقات) [العملية](/tag/العملية).
ثورة جديدة في الذكاء الاصطناعي: إطار التفكير المُوجه بلغة الشيفرة لحل مشكلات نماذج الرؤية واللغة!
تمكن إطار التفكير المنظم (PStar) من تقليل حالات الهلوسة في نماذج الرؤية واللغة، مما يعزز موثوقية الروبوتات في تنفيذ الأوامر المعقدة. هذا الإطار يعد خطوة محورية نحو أنظمة آلية أكثر أمانًا ودقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
