في عالم الذكاء الاصطناعي، حقق الوكلاء المعززون تقدمًا كبيرًا في التنقل نحو الكائنات المستهدفة. ولكن، هل الوصول إلى الهدف يضمن حقًا أن الوكيل قد وجد الكائن الصحيح؟! غالبًا ما تتطلب الاختلافات الطفيفة في الصفات، مثل 'الزهري الأبيض' مقابل 'المخطط الأبيض'، فحصًا دقيقًا عن قرب وبزوايا متعددة.
لملء هذه الفجوة، نقدم مفهوم التحقق النشط من الكائنات (Active Instance Verification - AIV). يتضمن ذلك مهمة يختار فيها الوكيل زوايا الرؤية حول كائن مرجعي ليقرر ما إذا كان يتوافق مع وصف طبيعي دقيق. لقد قمنا بتعريف AIV كعملية قرار محدودة المدى وأطلقنا PInVerify، معيارًا جديدًا يمكّن من تقويم أداء AIV في بيئة مغلقة.
يحتوي PInVerify على 3000 حلقة تقييم موزعة عبر 18 فئة من الكائنات، وقد تم تقديمه على شكل لقطات متعددة الزوايا مع طوبولوجيا تنقل من 6 قطاعات، مما يكشف عن زوايا فخ (trap views) غير مفيدة ولكن ممكنة التنقل إليها.
قمنا ببناء خط أنابيب بدون تدريب لتحويل البيانات وأعدنا ضبط وكيل منتهي في سلسلة كاملة باستخدام نماذج لغوية متعددة الوسائط مفتوحة المصدر (Multimodal Large Language Models - MLLMs). خلال تقييمنا عبر نماذج مثل Qwen3-VL وSenseNova-SI-1.2-InternVL3-8B، تجاوز أفضل خط الأساس المعتمد على MLLM النماذج المماثلة بمقدار 4.9 نقطة.
PInVerify لا يفتقد هذه التطورات البارزة. يمكن للوكيل المعدّل الوصول إلى دقة تبلغ 85.6%. يهدف هذا المعيار إلى دعم المزيد من الأبحاث حول التحقق الدقيق الدلالي النشط في الذكاء الاصطناعي المُجسد. إذا كنت من المهتمين بعوالم الذكاء الاصطناعي، فإن PInVerify سيكون حديث الساعة في المستقبل القريب!
PInVerify: معيار جديد يحقق معجزات التحقق من الكائنات في الذكاء الاصطناعي!
تقدم PInVerify معيارًا جديدًا يتيح لوكلاء الذكاء الاصطناعي التحقق بدقة من كائنات معينة من خلال تكتيكات مبتكرة. تعرف على كيف يمكن لهذا الإنجاز أن يحدث ثورة في أساليب التحقق النشطة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
