في عالم الذكاء الاصطناعي، يعد التفكير في affordance، أو فهم كيفية استخدام الأشياء بناءً على خصائصها الفيزيائية مثل الشكل والمادة، أمرًا ضروريًا لفهم البشر. ومع تطور نماذج اللغة الضخمة (Large Language Models) مثل الأجيال الحالية، أصبحت هذه القدرات أكثر أهمية. ومع ذلك، تواجه نماذج الذكاء الاصطناعي المستخدمة حاليًا تحديات في هذا المجال، خاصة مع الاعتماد على مخرجات معرفية مرتبطة بهوية الكائنات.
لذا، تم تقديم مشروع جديد بعنوان Affordance20Q، والذي يمثل معلمًا بارزًا في تقييم التفكير الحركي. هذا المشروع يقدم تحديًا في شكل لعبة "20 سؤالاً"، حيث يتعين على النموذج الذكي تخمين affordance لكائن مخفي من مجموعة مرشحة عبر طرح أسئلة بنعم أو لا حول الخصائص الفيزيائية لذلك الكائن. يتضمن Affordance20Q 1,009 لعبة، تغطي 454 كائنًا و59 affordance، وقد تم تصنيفها بعناية وتمييزها.
عند اختبار الأداء، وجد أن هناك فجوة ملحوظة تصل إلى 20 نقطة مقارنة بالأداء البشري، مما يشير إلى التحديات التي يواجهها الذكاء الاصطناعي في طرح الأسئلة الدقيقة مع تقدم اللعبة. ولتضييق هذه الفجوة، تم تطوير أسلوب جديد يسمى KB-Anchored Rule Induction (KARI)، الذي يعتمد على نماذج اللغة الضخمة لتحسين القواعد السلوكية التي تستند إلى أدلة من قواعد المعرفة.
يساهم KARI في تحسين أداء النماذج بمقدار يصل إلى 15.2 نقطة، رغم أن نقص تغطية قواعد المعرفة يشكل عائقاً أمام تحسينات إضافية. يمكنك الاطلاع على كافة الأكواد والبيانات الخاصة بالمشروع عبر GitHub.
هل تعتقد أن التفكير الحركي للذكاء الاصطناعي سيمكنه من فهم العالم مثل البشر؟ شاركونا آراءكم وأفكاركم في التعليقات!
تحدي Affordance20Q: كيفية تقييم تفكير الفهم الحركي من خصائص العالم الحقيقي
تقدم Affordance20Q مشروعًا مبتكرًا لتقييم قدرة نماذج الذكاء الاصطناعي على فهم affordance من خلال مجموعة من الأسئلة دون الكشف عن هوية الكائن. تمثل الاختبارات الجديدة خطوة مهمة نحو تحسين الأداء الفكري للذكاء الاصطناعي أمام المهام القريبة من التفكير البشري.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
