في عالم الذكاء الاصطناعي، تعتبر النماذج اللغوية الضخمة (Large Language Models) من أبرز الابتكارات التي غيرت طريقة تعاملنا مع البيانات. ومع ذلك، فإن منح هذه النماذج السيطرة المباشرة على التجارب العلمية المكلفة وغير القابلة للتراجع قد يؤدي إلى استكشاف غير آمن وأداء غير مستقر. لذلك، تم إطلاق نظام CARE (Controlling LLM-Generated Policies through Auditable Review of Evidence in Scientific Experimentation)، الذي يمثل حلاً مبتكرًا يسمح بالتحكم الفعّال والسيطرة القابلة للتدقيق في سياسات التجارب.

يعمل نظام CARE من خلال الحفاظ على مُحسِّن تقليدي كخط مسار افتراضي، بينما يستخدم النماذج اللغوية الضخمة لإعادة تقييم سياسات التصنيف. قبل الكشف عن أي نتيجة، يُعقد حاجز تدخل يُقارن التحدي بالمُحسِّن الحالي. يسمح بتحديد الخيار الجديد فقط عندما تدعم الأدلة المتاحة في ذلك الوقت التغيير، ويتم تسجيل القرار في سجل التدقيق.

لقد أثبتت التجارب أن نظام CARE يتفوق على جميع الطرق الأخرى التي تم تقييمها، حيث تم تحسين الأداء في اختبارات Minerva/Olympus وChemLex بشكل ملحوظ. وقد حقق النظام نسبة نجاح بلغت 88.5% في Minerva/Olympus، و92.1% في ChemLex، مقارنةً بالمُحسِّن التقليدي.

تُظهر النتائج أن التطور الذاتي للنماذج اللغوية الضخمة يمكن أن يكون أكثر موثوقية عندما يتم توسيع نطاق الاقتراحات تحت سيطرة قابلة للتدقيق، بدلاً من اتخاذ القرارات مباشرة حول التجارب. يعد هذا التطور خطوة مهمة نحو جعل الذكاء الاصطناعي أداة أكثر أمانًا وفعالية في مجال البحث العلمي.