في عالم يتسارع فيه استخدام التكنولوجيا، يمثل OpenComputer خطوة جديدة نحو تحسين مستويات الشفافية والموثوقية في برمجيات الكمبيوتر. هذه المبادرة المبتكرة تستعرض إطار عمل يقوم على أساس قابلية التحقق، مما يسمح لوكلاء الكمبيوتر (Computer-Use Agents) بالعمل بكفاءة أكبر وموثوقية أعلى.
يتكون OpenComputer من أربعة مكونات رئيسية:
1. **متحققات حالات التطبيق** (App-Specific State Verifiers) التي تقدم نقاط تفتيش منظمة عبر التطبيقات الحقيقية.
2. **طبقة التحقق ذاتية التطور** (Self-Evolving Verification Layer) التي تعزز موثوقية المتحققات من خلال ملاحظات مستندة إلى التنفيذ.
3. **خط أنابيب توليد المهام** (Task-Generation Pipeline) الذي يقوم بتوليف مهام مكتبية واقعية ويمكن التحقق منها آليًا.
4. **حلبة التقييم** (Evaluation Harness) التي تسجل المسارات كاملة وتحسب مكافآت جزئية قابلة للتدقيق.
في صيغتها الحالية، يغطي OpenComputer 33 تطبيقًا مكتبيًا ويشمل 1000 مهمة منوعة، تتراوح بين متصفحات الإنترنت وأدوات المكتب والبرامج الإبداعية وبيئات التطوير ومديري الملفات وتطبيقات التواصل.
تشير التجارب إلى أن المتحققات المحددة مسبقًا تتماشى بشكل أفضل مع تقييمات البشر مقارنةً بتقييمات نموذج اللغة الكبيرة كحكام (LLM-as-judge)، خصوصًا عندما تعتمد نجاح المهام على حالة التطبيق الدقيقة. بينما تواجه الوكلاء الرقمية تحديات في إكمال المهام من البداية إلى النهاية، تظهر نماذج المصادر المفتوحة تراجعًا حادًا في تقييمات OSWorld-Verified، مما يكشف عن الفجوة المستمرة في أتمتة الكمبيوتر القوية.
مع استمرار تطور هذا الإطار، من المتوقع أن يسهم OpenComputer في تحسين مهارات البرمجيات المعتمدة على الذكاء الاصطناعي، مما يفتح آفاق جديدة في عالم التكنولوجيا.
ما رأيكم في هذه التطورات المذهلة في عالم البرمجيات؟ شاركونا رؤاكم في التعليقات!
OpenComputer: ثورة في إنشاء عوالم برمجية قابلة للتحقق لوكلاء الكمبيوتر
تقدم OpenComputer إطار عمل مبتكر يعزز من قدرة الوكلاء الرقميين على التحقق من صحة برامجهم. يعتمد النموذج على أربعة مكونات رئيسية لتحسين أداء التطبيقات المكتبية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
