في السنوات الأخيرة، أصبح استخراج المعلومات السريرية من السجلات الطبية أمرًا معقدًا، خاصة عند التعامل مع ملاحظات تقدم العلاج، التي تتميز بطبيعتها غير المنظمة وحساسيتها للخصوصية. وللتغلب على هذه التحديات، تم تطوير إطار عمل يمكن نشره محليًا يتيح للنماذج اللغوية الصغيرة (Small Language Models) أن تقوم بتوليد، التحقق، تحسين، وتقييم أوامر محددة لاستخراج العديد من الكيانات السريرية من ملاحظات الأسنان.

اعتمد البحث على 1200 ملاحظة مصنفة لتقييم النموذج المرشّح باستخدام استنتاج متعدد الأوامر (multi-prompt ensemble inference)، وتم تعديل بعض النماذج المختارة باستخدام تقنية QLoRA الخاصة بالتدريب المعزز تحت الإشراف وتحسين التفضيلات المباشرة.

تنوعت أداء النماذج بشكل كبير، مما يبرز أهمية التقييم المحدد للمهام بدلاً من الاعتماد على مؤشرات معيارية عامة. حيث حقق نموذج Qwen2.5-14B-Instruct أدنى أداء مرجعي، وبعد تحسين التفضيلات، حقق كل من Qwen2.5-14B-Instruct و Llama-3.1-8B-Instruct درجات F1 دقيقة تصل إلى 0.864 و0.806 على التوالي.

تشير هذه النتائج إلى أن تحسين الأوامر بشكل آلي إلى جانب التدريب القائم على تفضيلات خفيفة يمكن أن يدعم استخراج معلومات سريرية قابلة للتوسع باستخدام نماذج لغوية صغيرة يتم نشرها محليًا.