في عالم الذكاء الاصطناعي المتطور، تُعد القدرة على استخدام الأدوات أحد العناصر الأساسية التي تمكّن نماذج اللغة الضخمة (Large Language Models) من التفاعل بفاعلية مع الأنظمة الخارجية من خلال استدعاءات وظيفية منظمة. ولكن، كانت الأبحاث السابقة تظهر تفاوتًا في تمثيل التفاعلات، مما أدى إلى تجاهل ما يتعلق بتوزيع الاستخدام الهيكلي للأدوات.

لحل هذه التحديات، تم تقديم UniToolCall، وهو إطار موحد لتعلم استخدام الأدوات، والذي يقوم بتوحيد كافة العمليات من بناء مجموعة الأدوات وتوليد البيانات وصولاً إلى التقييم. يضم هذا الإطار مجموعة ضخمة تضم أكثر من 22 ألف أداة، ويقوم بإنشاء مجموعة تدريب هجينة تحتوي على أكثر من 390 ألف حالة من خلال دمج 10 مجموعات بيانات عامة موحدة مع مسارات اصطناعية محكومة.

واحدة من المزايا البارزة في UniToolCall هي نمذجة أنماط التفاعل المتنوعة، بما في ذلك الاستخدام الأحادي والمتعدد الخطوات، مع مراعاة تنفيذ تتابعي ومتوازي. ولتعزيز القدرة على التفكير متعدد الجولات بشكل متسق، تم إدخال آلية "رابط التثبيت" التي تضمن الاعتماد المتبادل عبر الجولات.

علاوة على ذلك، تم تحويل 7 من المعايير العامة إلى تمثيل موحد يعتمد على نموذج استعلام--إجراء--ملاحظة--جواب (QAOA) مع تقييم متعمق على مستوى استدعاء الوظيفة، والجولة، والمحادثة. وقد أظهرت التجارب أن ضبط نموذج Qwen3-8B على مجموعة بيانات UniToolCall يحسن بشكل ملحوظ من أداء استخدام الأدوات، حيث حقق دقة صارمة بلغت 93.0% في الإعداد Hybrid-20، متفوقًا بذلك على النماذج التجارية مثل GPT وGemini وClaude.

بفضل هذا الإطار المبتكر، يُفتح أمام الباحثين والمطورين آفاق جديدة لتطوير حلول ذكاء اصطناعي أكثر قدرة على التفاعل والفاعلية. ما رأيكم في هذا التطور الكبير؟ شاركونا في التعليقات!