تعد رسومات المعرفة (Knowledge Graphs) أداة حيوية في تطوير قدرات الروبوتات على اتخاذ القرارات المستندة إلى المعلومات. مع تزايد الاعتماد على المحاكاة ثلاثية الأبعاد، يبرز التحدي الكبير في ربط الكائنات الموجودة في هذه المشاهد بتصنيفات رسمية، حيث تعتمد العديد من الأنظمة التقليدية على قواميس يدوية غير مرنة.
حاول الباحثون استخدام نماذج اللغة الضخمة (Large Language Models - LLMs) لتجاوز هذه العقبة بطريقة غير مُدرَبة (Zero-Shot) من خلال تطبيق نتائجهم على مشهد مطبخي يتضمن 125 كائنًا. أظهرت التجارب أن LLMs تمكنت من تحقيق دقة مباراة مطابقة قدرها 90-96% عند استخدام أسماء وصفية، و49-89% عند استخدام أسماء مختصرة، متجاوزة بذلك المعايير التقليدية المعتمدة على القواميس.
وعندما تم استخدام أسماء غامضة تمامًا، تمكن علماء البحث من استعادة ما يصل إلى 48% من النتائج بدقة عبر تكنولوجيا التعزيز السياقي (Context-Augmented Prompting). وبهذا، يبين البحث أن LLMs تستفيد بشكل رئيسي من المؤشرات الدلالية في الرسم البياني للمشهد (scene graph) مثل أسماء الكائنات المجاورة ومسارات الأنساب. لكن عندما تم إخفاء هذه المؤشرات، انخفضت الدقة بشكل كبير إلى 0-6%، بينما كانت النتائج باستخدام بيانات الهيكل فقط ضئيلة بين 4-17%.
تؤكد هذه النتائج على القوة الكامنة في استخدام تقنيات الذكاء الاصطناعي لتبسيط الأتمتة وزيادة قدرة الروبوتات على التعامل مع بيئات معقدة بذكاء.
نقل المشاهد من USD إلى رسومات المعرفة: كيفية استخدام نماذج اللغة الضخمة لجعل الروبوتات أكثر ذكاءً!
تمكن الباحثون من استخدام نماذج اللغة الضخمة (LLMs) لأتمتة خطوات ربط الكائنات بتصنيفات رسمية، مما يزيد دقة التعرف على المشاهد في تطبيقات الروبوتات. نتائج الدراسة تشير إلى إمكانية تحسين قدرات الروبوتات بشكل ملحوظ من خلال هذه التقنية الحديثة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
