في عالم الذكاء الاصطناعي، يُعتبر تدريب وكلاء نماذج اللغات الضخمة (LLMs) على بيانات محادثات غنية بالأدوات تحديًا معقدًا. إذ يتطلب الأمر كميات ضخمة من البيانات التي تتضمن محادثات متعددة الأبعاد، وهو ما قد يكون مكلفًا وصعب التجميع من حيث الخصوصية. ومع ذلك، ظهرت منصة جديدة تدعى StateGen لتلبي هذه الحاجة.

تقوم StateGen بتوليد بيانات اصطناعية عن طريق تفاعل أربعة أدوار في حلقة ديناميكية: محاكي مستخدم مشروط بالشخصية، وكيل تحت الاختبار، محاكي أدوات مرتبط بالحالة، ومقيّم يحتوي على نموذج لغة متعدد الأبعاد.

ما يميز هذه المنصة هو مدير الحالة الذي يحافظ على كائن حالة منظم عبر مختلف الأدوار، مما يضمن دقة البيانات ويقلل من احتمالية حدوث الهلاوس أثناء استدعاء الأدوات. كما تدعم StateGen أيضًا بيئات متعددة الوكلاء، حيث يمكن تعريف وكلاء فرعيين كأدوات تشترك جميعها في كائن حالة واحد.

أظهرت التقارير الأخيرة أن النظام قام بتقييم 64,698 محادثة باستخدام ثلاث قواعد بيانات إنتاج، وسجلت المنصة درجات تصل إلى 9.66 من 10 فيما يتعلق بهلاوس استدعاء الأدوات. بالإضافة إلى ذلك، تدعم النظام تنوع الشخصيات عبر متجهات صفات مكونة من 23 بُعدًا، مما يعزز من تفاعل المحادثات.

مقارنةً مع ثمانية أنظمة خارجية أخرى، يتضح أن لا منصة واحدة متاحة للجمهور تقدم توليد محادثات متعددة الأبعاد، ومحاكاة أدوات مرتبطة بالحالة، ودعم الهياكل الهرمية للعوامل المساعدة. هذا يجعل من StateGen منصة فريدة من نوعها في عالم الذكاء الاصطناعي.