تواجه الأنظمة المعلوماتية الحديثة تحديات كبيرة في تحقيق الاستقلالية، حيث تحتاج إلى وكالات قادرة على التنقل في سير العمل المعقد بشكل آلي. غالبًا ما تصطدم الأساليب الحالية بصعوبة الانتقال من تحليل البيانات الهيكلية إلى الفهم العام للبيئة المتغيرة. ومع ظهور نماذج اللغات الضخمة متعددة الوسائط (Multimodal Large Language Models)، أصبح بإمكان الوكالات التفاعل مباشرة مع واجهات المستخدم الرسومية، لكن غالبًا ما يُنظر إلى تسلسل المهام على أنه حلقات منفصلة وغير مترابطة. هذا التفكيك يعيق قدرة الوكالات على فهم البنية الأساسية للتحول، مما يحد من فعاليتها في سيناريوهات جديدة أو متغيرة.
لذلك، نقدم إطار عمل مبتكر يعتمد على وكالات متعددة الوسائط لتحقيق تنفيذ تلقائي للسير العمل من خلال pipeline مكون من مرحلتين. في المرحلة الأولى، يُنشئ الإطار قاعدة معرفية طوبوغرافية بشكل تكيفي من سجلات التنفيذ المجزأة خلال مرحلة الاكتشاف غير المتصلة. أثناء عملية الاستنتاج، تستخدم الوكالات تقنية استرجاع التعزيز التكيفي (Adaptive Retrieval-Augmented Generation) فوق الرسوم البيانية المثبتة مسبقًا، مصحوبة ببروتوكول تحقق تعاوني مغلق لديناميكية التصحيح الذاتي والتنقل.
تساعد هذه الطريقة المعتمدة على الرسوم البيانية في تحسين تقسيم المهام وزيادة أداء التنقل التكيفي. وقد تم التحقق من موثوقية إطار العمل في سياق العالم الحقيقي، حيث أثبتت قدرته على الحفاظ على مستوى عالٍ من الاعتمادية والوعي الدلالي حتى مع وجود بيانات تدريب محدودة.
إطار عمل مبتكر للوكالات المتعددة الوسائط لتنفيذ سير العمل بشكل تلقائي
في عالم اليوم، تتطلب الأنظمة المعلوماتية وكالات مستقلة قادرة على التعامل مع سير العمل المعقد. يقدم هذا المقال إطار عمل متطور يجمع بين تقنيات متعددة الوسائط لتحقيق تنفيذ تلقائي فعّال وموثوق.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
