في خطوة ثورية جديدة نحو تحسين أداء نماذج اللغات الضخمة (LLMs) في مجال الإجابة عن الأسئلة الطبية، تم إدخال طريقة مبتكرة تتمثل في المراجعة الذاتية بين الوكلاء. يهدف هذا النظام إلى تعزيز دقة وموثوقية الإجابات المقدمة من هذه النماذج.

تعتمد هذه الطريقة على تصميم نظام يتضمن عدة وكلاء من نماذج اللغات التي تعمل كمراجعين مستقلين. حيث يقوم كل وكيل بإنشاء سلسلة من الأسباب المحتملة التي تتعلق بالإجابة، وبعد ذلك يتبادل هؤلاء الوكلاء الأدوار كمراجعين لتقييم مدى صحة وموضوعية تلك الأسباب.

خلال التجارب، تم اختبار خمسة نماذج متقدمة من اللغات مثل Llama-3.1-8B و GPT-oss-20B على مجموعات بيانات مرجعية معروفة مثل HeadQA وMedQA-USMLE. وبالمقارنة مع الطرق التقليدية، أثبتت طريقة المراجعة الذاتية تفوقها في الأداء حيث حققت أفضل مجموعة من النماذج دقة تصل إلى 0.820.

بينما كانت النماذج الفردية تحقق دقة 0.777، وجدت النتائج أن نظام التصويت الجماعي لم يكن قادرًا على مجاراة أداء طريقة المراجعة الذاتية، التي تدل على أن تقييم جودة التفكير بشكل مستقل قد يكون المفتاح لتحسين النتائج.

تعد هذه الطريقة توسعًا مثيرًا، حيث إنه كلما زاد عدد المشاركين من النماذج، زادت فعالية الأداء. وبالتالي، تساعد هذه المراجعة الذاتية في تمييز أفكار التفكير عالية الجودة من تلك المنخفضة، مما يعزز الثقة في الأنظمة الطبية المدعومة بالذكاء الاصطناعي.

تعتبر هذه الخطوة رحلة واعدة نحو بناء أنظمة ذكاء اصطناعي موثوقة في المجال الطبي تعزز من مستوى الرعاية الصحية وجودة المعلومات المقدمة للمرضى.