في عالم التصوير العلمي (Scientific Visualization)، حيث تتفاعل اللغة الطبيعية مع أدوات تحليل البيانات، تنبثق أدوار جديدة لنماذج اللغة الكبيرة (Large Language Models) لتحقيق نتائج مبهرة. من خلال دراسة شاملة، تقدم هذه الورقة رؤية معمقة حول كيفية أداء أنواع مختلفة من الوكلاء الذكيين في المهام المتعلقة بالتصوير العلمي.

تتمثل المهمة الأساسية للوكلاء في توليد تدفقات عمل مرئية بناءً على التعليمات النصية الطبيعية. في هذا السياق، تم مقارنة ثلاثة أنماط رئيسية للتفاعل:
1. **الوكلاء المتخصصون** في المجال الذين يستخدمون أدوات منظمة.
2. **وكلاء استخدام الحواسيب**.
3. **الوكلاء ذوو الأغراض العامة**.
تم تقييم ما يصل إلى ثمانية وكلاء عبر 15 مهمة معيارية، مع قياس جودة التصوير، الكفاءة، المتانة، والتكلفة الحاسوبية.

الأبحاث تكشف عن أن لكل نمط تفاعل مزايا وعيوب. على سبيل المثال، الوكلاء ذوو الأغراض العامة حققوا أعلى معدلات نجاح في المهام، لكنهم كانوا مكلفين من حيث الموارد الحاسوبية. بينما كانت كفاءة الوكلاء المتخصصين أكبر، كانوا يفتقرون إلى المرونة المطلوبة في بعض المواقف.

أما بالنسبة لوكلاء استخدام الحواسيب، فقد أبدوا أداءً جيدًا في خطوات فردية، إلا أنهم واجهوا صعوبة في التعامل مع التدفقات الأكثر تعقيدًا والتي تتطلب تخطيطًا طويلاً. هذه التحديات تشير إلى ضرورة إيجاد توازن بين أداء الوكلاء ومرونتهم.

في بيئات التفاعل القائمة على واجهات الأوامر (CLI) والواجهات الرسومية (GUI)، ساعدت الذاكرة الدائمة في تحسين الأداء عبر التجارب المتكررة. غير أن فوائدها كانت مرتبطة بنمط التفاعل وجودة التغذية الراجعة.

تظهر نتائج هذه الدراسة أن لا نهج واحد يكفي لتلبية جميع الاحتياجات، مما يتطلب من أنظمة التصوير العلمي المستقبلية دمج استخدام أدوات منظمة، وقدرات تفاعلية، وآليات ذاكرة قابلة للتكيف لتحقيق توازن بين الأداء، المتانة، والمرونة.