في عالم الطب الحديث، تعد الموثوقية والدقة في التشخيصات الطبية أمراً بالغ الأهمية، خاصة في ظل الحاجة المتزايدة لتقديم الرعاية الصحية بلغات متعددة. تمثل نماذج اللغات الضخمة (Large Language Models - LLMs) حلاً واعداً، حيث توفر دعمًا للقرارات السريرية بما في ذلك التشخيصات متعددة اللغات في البيئات المحدودة الموارد.

تقدم الدراسة الجديدة تحليلاً عميقاً لتشخيص العظام باستخدام نصوص عيادية حرة مكتوبة باللغات الإنجليزية والهندية والبنجابية. تم تقييم ثلاثة أنظمة نموذجية:
1. المحولات المتعددة اللغات المتوافقة مع المهام،
2. نموذج مُعدل بدقة (DistilBERT)،
3. معمارية متخصصة تتكيف مع نصوص العظام (IndicBERT-HPA).

تم مقارنة هذه النماذج مع نماذج LLMs تعتمد على التعليمات بدون تدريب (zero-shot models) لتقييم ملاءمتها لتصنيف التشخيصات المنظم. أظهرت النتائج أن نماذج اللغات الضخمة تتمتع بطلاقة لغوية عالية، لكنها تعاني من عدم استقرار في المعايير وموثوقية منخفضة في ظروف متعددة اللغات، خصوصاً في اللغات ذات الموارد المحدودة.

ومع ذلك، أظهرت النماذج المتخصصة في مجال معين تحسناً ملحوظاً في التمييز عبر اللغات وسلوك الثقة. فعن طريق استخدام IndicBERT-HPA ذات المكونات المتخصصة في العظام، تم تحقيق أداء قوي ومتسق في ست فئات تشخيصية مع خصائص نشر أكثر قابلية للتنبؤ.

استناداً إلى هذه الملاحظات، تم وضع إطار عمل للتحقق من صحة الأنظمة يعتمد على مفهوم الوكلاء الم determinist؛ مما ينظم عمليات التحقق من الأدلة، والتحقق القائم على الحساسيات اللغوية، وآليات التحكم البشري. إن دعم القرارات السريرية متعددة اللغات يتطلب بنية متخصصة، وتحليل موثوقية صريح، والتحقق الهيكلي للأنظمة الحرجة من حيث السلامة.