في عالم البيولوجيا النظامية، يُعتبر التنبؤ بالاستجابات الخلوية للتغيرات الجينية تحديًا جوهريًا يؤثر بشكل مباشر على اكتشاف العلاجات ونمذجة الخلايا الافتراضية. ورغم أن نماذج اللغة الكبيرة (Large Language Models - LLMs) أثبتت فعاليتها في مجال الاستدلال البيولوجي، إلا أن تطبيقها في توقع التغيرات الجينية لا يزال يواجه بعض العقبات، خصوصًا فيما يتعلق بتكيفها مع البيانات التجريبية المهيكلة.
نقدم لكم تقنية SynthPert، وهي طريقة مبتكرة تقوم بتحسين أداء نماذج LLMs عبر عملية التخصيص المعززة (supervised fine-tuning) باستخدام آثار استدلالية صناعية تم إنشاؤها بواسطة نماذج رائدة. من خلال اختبارنا باستخدام معيار PerturbQA، أثبتنا أن منهجنا لا يحقق فقط أداءً متفوقًا، بل يتفوق أيضًا على قدرات النموذج الرائد الذيGenerated data used to train it.
تشير نتائجنا إلى ثلاثة رؤى رئيسية: 1) الآثار الاستدلالية الصناعية تستطيع تقطير المعرفة البيولوجية بكفاءة حتى وإن كانت جزئيًا غير دقيقة، 2) يمكّن هذا النهج من تعميم النتائج عبر أنواع خلايا مختلفة بدقة تصل إلى 87% على خلايا RPE1 غير المرئية، و3) تستمر المكاسب في الأداء رغم استخدام 2% فقط من بيانات التدريب المصفاة عالية الجودة.
تظهر هذه الدراسة فعالية عملية تقطير الاستدلال الاصطناعي لتطوير قدرة الاستدلال في مجالات معينة داخل نماذج الذكاء الاصطناعي، مما يبشر بمستقبل واعد في تطبيقات البيولوجيا النظامية والممارسات الطبية.
ثورة في البيولوجيا: SynthPert تحسن قدرة نماذج الذكاء الاصطناعي على التنبؤ بتأثيرات التغيرات الجينية!
تقدم تقنية SynthPert الجديدة بديلاً مبتكرًا لتحسين أداء نماذج الذكاء الاصطناعي في التنبؤ بالاستجابات الخلوية للتغيرات الجينية. تعتمد على إنشاء آثار استدلالية صناعية لمساعدتها في تجاوز التحديات الحالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
