في عالم الذكاء الاصطناعي، تعتبر النماذج اللغوية الضخمة (Large Language Models) من أبرز الابتكارات التي غيرت طريقة تعاملنا مع البيانات. ومع ذلك، فإن منح هذه النماذج السيطرة المباشرة على التجارب العلمية المكلفة وغير القابلة للتراجع قد يؤدي إلى استكشاف غير آمن وأداء غير مستقر. لذلك، تم إطلاق نظام CARE (Controlling LLM-Generated Policies through Auditable Review of Evidence in Scientific Experimentation)، الذي يمثل حلاً مبتكرًا يسمح بالتحكم الفعّال والسيطرة القابلة للتدقيق في سياسات التجارب.
يعمل نظام CARE من خلال الحفاظ على مُحسِّن تقليدي كخط مسار افتراضي، بينما يستخدم النماذج اللغوية الضخمة لإعادة تقييم سياسات التصنيف. قبل الكشف عن أي نتيجة، يُعقد حاجز تدخل يُقارن التحدي بالمُحسِّن الحالي. يسمح بتحديد الخيار الجديد فقط عندما تدعم الأدلة المتاحة في ذلك الوقت التغيير، ويتم تسجيل القرار في سجل التدقيق.
لقد أثبتت التجارب أن نظام CARE يتفوق على جميع الطرق الأخرى التي تم تقييمها، حيث تم تحسين الأداء في اختبارات Minerva/Olympus وChemLex بشكل ملحوظ. وقد حقق النظام نسبة نجاح بلغت 88.5% في Minerva/Olympus، و92.1% في ChemLex، مقارنةً بالمُحسِّن التقليدي.
تُظهر النتائج أن التطور الذاتي للنماذج اللغوية الضخمة يمكن أن يكون أكثر موثوقية عندما يتم توسيع نطاق الاقتراحات تحت سيطرة قابلة للتدقيق، بدلاً من اتخاذ القرارات مباشرة حول التجارب. يعد هذا التطور خطوة مهمة نحو جعل الذكاء الاصطناعي أداة أكثر أمانًا وفعالية في مجال البحث العلمي.
CARE: ثورة جديدة في التحكم بسياسات النماذج اللغوية الضخمة من خلال مراجعة قابلة للتدقيق في التجارب العلمية
تقدم الدراسة الجديدة نظام CARE الذي يسمح بالتحكم في سياسات النماذج اللغوية الضخمة (LLMs) بشكل آمن وفعّال. يهدف النظام إلى الحفاظ على الابتكار مع تقليل المخاطر المتعلقة بالتجارب العلمية المكلفة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
