إطلاق InfiMed-ORBIT: ثورة في تدريب نماذج اللغة على المهام الطبية المفتوحة!

Q: ما هو موضوع مقال "إطلاق InfiMed-ORBIT: ثورة في تدريب نماذج اللغة على المهام الطبية المفتوحة!"؟

يتناول المقال بالتفصيل والتحليل آخر الأخبار والتطورات المتعلقة بـ "إطلاق InfiMed-ORBIT: ثورة في تدريب نماذج اللغة على المهام الطبية المفتوحة!" في عالم الذكاء الاصطناعي والتكنولوجيا الناشئة.

تعرفوا على InfiMed-ORBIT، الإطار الجديد الذي يعزز نماذج اللغة الكبيرة (LLMs) لتقديم استجابات دقيقة ومؤثرة في الحوارات الطبية المعقدة. بفضل أسلوب التدريب المعتمد على التقييمات الديناميكية، يمكن للنماذج التعامل مع تحديات جديدة بكفاءة أعلى.

في عالم الذكاء الاصطناعي، أسهم التعلم المعزز (Reinforcement Learning) في تحقيق إنجازات مذهلة في نماذج اللغة الكبيرة (LLMs)، خاصة عندما يكون من السهل حساب المكافآت تلقائيًا، كما في توليد الأكواد. ولكن عندما يتعلق الأمر بالحوار الطبي المفتوح، تصبح الأمور أكثر تعقيدًا. فالتغذية الراجعة هنا غالبًا ما تكون غير واضحة، تعتمد على السياق، وصعبة الاختصار إلى إشارة وحيدة.

في هذا الإطار، يبرز InfiMed-ORBIT كحل مبتكر، حيث يقدم طريقة تدريب تدريجية تعتمد على التقييمات. يدمج ORBIT بين بناء الحوارات الطبية وتوليد معايير تقييم ديناميكية تعتمد على الحالات، مما يوفر إرشادات مرنة لتدريب التعلم المعزز. وهذه الطريقة تختلف عن الأساليب التي تعتمد على قواعد المعرفة الطبية الخارجية أو القواعد اليدوية، حيث يمكن دمجها بسهولة مع نماذج اللغة العامة، مما يقلل من الحاجة لجلسات ضبط محددة للمهام.

ببساطة، باستخدام فقط 2000 نموذج تدريب، تمكن ORBIT من رفع معدل أداء نموذج Qwen3-4B-Instruct في HealthBench-Hard من 7.0 إلى 27.5. وهذا يعد إنجازًا كبيرًا حيث يحقق أداءً متفوقًا مقارنة بالنماذج الأخرى ذات الحجم المماثل، مع الحفاظ على جودة الاستشارات المتزايدة مع توسع شمولية المعايير.

جاري تحميل التفاعلات...

إطلاق InfiMed-ORBIT: ثورة في تدريب نماذج اللغة على المهام الطبية المفتوحة!

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

ثورة ذكاء اصطناعي: المساعد الجديد من أدوبي يمكنه إنجاز المهام عبر جميع تطبيقاتك الإبداعية!

ثورة جديدة في عالم الحوسبة: استثمار ضخم ينذر بإطلاق عملاق الحوسبة التالي

هل تتجه أنظار المستثمرين نحو Anthropic بعد موجة الدولار؟