في عالم [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) المتطور، يظهر الإطار الجديد ReCrit كحل مبتكر يعالج قضايا [التفاعل](/tag/التفاعل) بين [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models)) والمراجعين. إذ تشير [الأبحاث](/tag/الأبحاث) إلى أن هذه [النماذج](/tag/النماذج) قد تتعرض لفشل twin عندما تتعامل مع النقد، مما يؤدي أحياناً إلى التخلي عن إجابات علمية صحيحة بعد [توجيه](/tag/توجيه) النقد من قبل المستخدمين. وهذا الأمر خطر بشكل خاص في مجالات [البحث](/tag/البحث) العلمي، حيث يمكن لنقد المستخدم أن يحوّل إجابة صائبة إلى أخرى خاطئة.
يتمثل جوهر برنامج ReCrit في معالجة مشكلة الانتقال بين الإجابات الصحيحة والنقد بشكل مختلف، حيث يتم [تحويل](/tag/تحويل) التركيز من [دقة الإجابة](/tag/[دقة](/tag/دقة)-الإجابة) النهائية إلى [دقة](/tag/دقة) [التفاعل](/tag/التفاعل). هذا الإطار عرف ثلاثة [تحديات](/tag/تحديات) رئيسية: [الوعي](/tag/الوعي) بالانتقال، فصل التصحيح المفيد عن المجاملة الضارة، والإطلاق القابل للتطوير.
يتم تقسيم [سلوك](/tag/سلوك) النموذج من "البداية إلى المراجعة" إلى أربعة أرباع: التصحيح، المجاملة، المتانة، والحدود. يعمل ReCrit على [مكافأة](/tag/مكافأة) التصحيح والمتانة، بينما يعاقب المجاملة، ويعتبر [الأخطاء](/tag/الأخطاء) المستمرة [إشارات](/tag/إشارات) حدود ضعيفة.
وبفضل استخدام [تقنيات](/tag/تقنيات) النشر الديناميكي غير المتزامن مع إكمال متكيف، يجعل ReCrit [التدريب](/tag/التدريب) على [التفاعل](/tag/التفاعل) أكثر عملية. أظهرت [نتائج التجارب](/tag/نتائج-[التجارب](/tag/التجارب)) على ثلاثة [معايير](/tag/معايير) حالية في [البحث العلمي](/tag/[البحث](/tag/البحث)-العلمي) - ChemBench، TRQA، وEarthSE - أن ReCrit يعمل على [تحسين](/tag/تحسين) [دقة](/tag/دقة) النقد من 38.15 إلى 51.49 على [نموذج](/tag/نموذج) [Qwen3.5](/tag/qwen35)-4B ومن 45.40 إلى 55.59 على [Qwen3.5](/tag/qwen35)-9B.
التحليلات الإضافية أظهرت أن [مكافآت](/tag/مكافآت) الإجابة النهائية توفر مزايا محدودة على مستوى التفاعل، بينما توفر [مكافآت](/tag/مكافآت) [الوعي](/tag/الوعي) بالانتقال وتأثيرات الأرباع [إشارات](/tag/إشارات) تدريبية أكثر تميزًا وتحسينًا أكبر في مرحلة النقد. يمكنك العثور على الشيفرة المصدرية لـ ReCrit على [GitHub](/tag/github) [عبر](/tag/عبر) هذا الرابط: https://github.com/black-yt/ReCrit.
في النهاية، كيف تعتقد أن هذه التقنيات ستؤثر على [مستقبل](/tag/مستقبل) [البحث العلمي](/tag/[البحث](/tag/البحث)-العلمي) وتفاعل [النماذج](/tag/النماذج) مع النقد؟ شاركونا آراءكم في [التعليقات](/tag/التعليقات).
ReCrit: تعزيز الذكاء الاصطناعي لفهم المراجعات العلمية وتأثيرها الثوري
تمثل ReCrit إطارًا مبتكرًا يجمع بين التعلم المعزز (Reinforcement Learning) وفهم الانتقالات في التفاعل مع المراجعين، مما يعزز دقة نماذج الذكاء الاصطناعي في البحث العلمي. بفضل هذه التقنية، يمكن للنماذج تحسين أدائها في تحليل الآراء العلمية بشكل ملحوظ.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
