في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) المتطور، تظهر [تقنيات جديدة](/tag/[تقنيات](/tag/تقنيات)-جديدة) تبتكر في كيفية [تفاعل](/tag/تفاعل) الأنظمة مع [التعليمات](/tag/التعليمات) والمعلومات. من أحدث [الابتكارات](/tag/الابتكارات) هو نظام DISC، الذي يعيد تشكيل طريقة [التحكم](/tag/التحكم) الذكي (Intelligent Control) [عبر](/tag/عبر) فصل [التعليمات](/tag/التعليمات) عن حالة المهمة.
تُعاني الأنظمة التقليدية من مشكلة "تشابك المهام"، حيث تتداخل [التعليمات](/tag/التعليمات) مع الملاحظات مما قد يؤدي إلى [تسرب المعلومات](/tag/تسرب-[المعلومات](/tag/المعلومات)) ويجعل [الشبكات](/tag/الشبكات) تتعلم اختصارات غير موثوقة وغير مبنية على [اللغة](/tag/اللغة). لكن نظام DISC يتجاوز هذه العوائق بنجاح.
بدلاً من الاعتماد على [سياسة](/tag/سياسة) عامة تتوسّع حول [لغة](/tag/لغة) معينة، يقوم DISC باستخدام شبكة هايبر (Hypernetwork) لتوليد مجموعة كاملة من معلمات [سياسة](/tag/سياسة) التلاعب البصرية (Visuomotor Policy) المتخصصة استنادًا إلى [التعليمات](/tag/التعليمات) فقط. هذه السياسة المولدة لا تصل مباشرة إلى اللغة، مما يعزز من وعيها بالمهام ويمنع أي تسرب للملاحظات.
ومع ذلك، فإن إنشاء معلمات [سياسة](/tag/سياسة) مُتسقة في [أبعاد عالية](/tag/أبعاد-عالية) هو تحدٍ بحد ذاته. يواجه DISC هذا التحدي [عبر](/tag/عبر) اعتماد شبكة هايبر ذات مرحلتين، حيث تتضمن مرحلة [التحسين](/tag/التحسين) بنية [التحسين](/tag/التحسين) المعتمد على التدرج كتحيز استدلالي، مما ينتج معلمات متسقة على مستوى عالمي دون الحاجة إلى [حساب](/tag/حساب) [التدرجات](/tag/التدرجات) الفعلية.
من خلال [التدريب](/tag/التدريب) من الصفر على ميزانيات [بيانات](/tag/بيانات) قياسية، أثبت نظام DISC كفاءته عند مقارنته بجميع [السياسات](/tag/السياسات) السابقة المتشابكة على [مجموعة بيانات](/tag/مجموعة-[بيانات](/tag/بيانات)) LIBERO-90 وMeta-World، مع [تحقيق](/tag/تحقيق) مزايا تتسع في المهام المعقدة والطويلة الأمد. كما يتجاوز [أداء](/tag/أداء) نظام DISC نطاق التمهيد المسبق على الرغم من عدم الاعتماد على أي [بيانات](/tag/بيانات) تمهيدية خارجية.
علاوة على ذلك، في معيار واقعي حيث تتشارك جميع المهام نفس [السياق](/tag/السياق) البصري، يتفوق DISC بشكل ملحوظ على البدائل المتشابكة، مؤكداً أن مُعلمات السياسة المولدة من قبل اللغة، وليس [الاختصارات](/tag/الاختصارات) المرئية، هي التي تدفع السلوك. ولتسهيل [التكيف](/tag/التكيف) السريع والتعميم القوي [عبر](/tag/عبر) [التعليمات](/tag/التعليمات) المُعاد صياغتها، تتعلم شبكة الهايبر أيضًا مجموعة معلمات بنائية دلاليًا.
للاستزادة، يمكنك الاطلاع على الشيفرة المصدرية الخاصة بنظام DISC على [GitHub](/tag/github).
تحطيم الحدود: كيف يحقق نظام DISC التحكم الذكي عبر سياسات التلاعب المبتكرة
يقدم نظام DISC طريقة ثورية لتحسين عملية التحكم الذكي من خلال فصل التعليمات عن سياقات الحالة. يعتمد على توليد سياسات التلاعب باستخدام شبكة هايبر (Hypernetwork) مما يتيح تفادي التسريبات المرئية بشكل فعال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
