في خطوة مبتكرة نحو تحسين تجربة مستخدمي PowerPoint، تم إطلاق PPTArena، وهو معيار قوي يهدف إلى تقييم كيفية تعديل الوكلاء (agents) لشرائح PowerPoint الحقيقية استنادًا إلى أوامر باللغة الطبيعية. يختلف هذا المنهج عن المعايير الأخرى التي تعتمد على إنشاء شرائح من صورة أو PDF، حيث يوفر PPTArena 100 مجموعة شريحة تحتوي على أكثر من 1300 تعديل تم تنسيقه من قبل البشر عبر 2125 شريحة، متضمنة النصوص، الرسوم البيانية، الرسوم المتحركة، وأنماط الماستر الاحترافية.
كل تعديل في PPTArena مرتبط بمجموعة شريحة محددة ونموذج يستند إلى المعايير، ويتم تقييم أدائه من خلال اثنين من حكام نموذج الرؤية واللغة (Vision-Language Model - VLM). الأول يقيّم مدى اتباع التوجيهات بناءً على الاختلافات الهيكلية، بينما يقوم الآخر بتقييم الجودة البصرية من خلال الصور.
بالإضافة إلى ذلك، تم تقديم PPTPilot، وهو وكيل واعٍ بالهيكل قادر على تخطيط تسلسلات تعديل دلالية، والتوجيه بين الأدوات البرمجية وعمليات XML المحددة بشكل deterministic، وتحقق من نتيجة كل تعديل ضمن حلقة تخطيط-تعديل-تحقق تكرارية. وقد أظهر PPTPilot أداءً متفوقًا على الوكلاء المعتمدين على نموذج VLM بأكثر من 10 نقاط مئوية فيما يخص التعديلات المركبة، وتلك الحساسة للتخطيط، والتعديلات البينية، مع تحقيق مكاسب كبيرة في جودة العرض والتناسق عبر مجموعة الشرائح.
رغم ذلك، لا تزال جميع الوكلاء تواجه تحديات عند التعامل مع المهام طويلة الأمد على مستوى الوثائق، مما يبرز الصعوبة المستمرة التي تمثلها عملية تحرير PowerPoint بشكل موثوق. يمكنكم الآن الاطلاع على التعليمات البرمجية الخاصة بتقنية PPTArena من خلال الرابط التالي: https://github.com/michaelofengend/PPTArena.
إطلاق PPTArena: معيار ثوري لتحرير PowerPoint بجودة استثنائية!
شهدنا إطلاق PPTArena كمعيار جديد لتقييم تحرير شرائح PowerPoint بدقة عالية، مما يعزز من كفاءة استخدام الذكاء الاصطناعي في تعديل النصوص والتصاميم. يرافقه إطلاق PPTPilot، الوكيل الذكي القادر على تحسين تنفيذ التعديلات بشكل فعال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
