في عالم الذكاء الاصطناعي، يسعى الباحثون إلى فهم كيفية اكتساب الأنظمة للمعرفة البشرية. في هذا السياق، يبرز مفهوم IPR-1 (Interactive Physical Reasoner) كنموذج ثوري يهدف إلى تحقيق تفكير فيزيائي أكثر فعالية من خلال التفاعل مع بيئات متعددة.
يُعتبر التعلم عن طريق الملاحظة والتفاعل جزءًا أساسيًا من التربية البشرية. ولذلك، يطرح الباحثون سؤالًا محوريًا: هل يمكن للذكاء الاصطناعي أن يكتسب تفكيرًا مشابهًا للبشر عبر التفاعل وتعلم الفيزياء والسببية؟
لتعزيز هذا الفهم، تم تقديم معيار جديد يسمى G2U (Game-to-Unseen)، مع مراعاة أكثر من 1000 لعبة متنوعة تُظهر فجوات بصرية كبيرة. تظهر الطرق الحالية، مثل Mod من نماذج اللغات الضخمة (VLMs) ونماذج العالم، صعوبات في التقاط الفيزياء الأساسية والسببية، حيث تركز على التفاصيل المرئية دون النظر إلى الآليات الأساسية.
بينما يمكن لعوامل VLM/VLA التفكير، تفتقر إلى توقع النتائج في البيئات التفاعلية. من ناحية أخرى، تتخيل نماذج العالم ولكنها تقلد الأنماط المرئية بدلاً من تحليل الفيزياء والسببية.
ولذلك، تم اقتراح IPR-1 كمزيج مبتكر، حيث يستخدم نتائج نماذج العالم لتقييم وتعزيز سياسة نموذج VLM. كما تم تقديم PhysCode، وهو كود عمل يركز على الفيزياء ينسق النية الدلالية مع الديناميات، مما يوفر مساحة عمل مشتركة للتنبؤ والتفكير.
مع التدريب على أكثر من 1000 لعبة، يُظهر IPR-1 أداءً قويًا بمستويات تتراوح من الحدس البدائي إلى التفكير المدفوع بالأهداف، ويتجاوز حتى أداء GPT-5. تشير النتائج إلى أن الأداء يتحسن مع زيادة عدد الألعاب وخطوات التفاعل وكذلك انتقل النموذج بشكل فعال إلى ألعاب غير مسموعة.
تمثل هذه النتائج دليلًا على أن التفاعل المركزي حول الفيزياء هو مسار لتحسين مستمر في التفكير الفيزيائي. يمكنكم الاطلاع على المزيد من العروض التوضيحية وتفاصيل المشروع عبر الرابط: [https://mybearyzhang.github.io/ipr-1]
ثورة الذكاء الاصطناعي: IPR-1 يفك شفرة التفكير الفيزيائي بطريقة تفاعلية!
تقدم الدراسة الجديدة مفهوم IPR-1، وهو نموذج ذكاء اصطناعي يحقق قفزة نوعية في القدرة على التفكير الفيزيائي عبر تفاعله مع بيئات متنوعة. يتجاوز أداء هذا النموذج ما تم تحقيقه سابقًا، بما في ذلك الأنظمة المعروفة مثل GPT-5.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
