في عالم يتجه [نحو](/tag/نحو) الاعتماد المتزايد على [نماذج](/tag/نماذج) الذكاء الاصطناعي، قدم [فريق](/tag/فريق) بحثي [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) تحت عنوان LEAP، والتي تهدف إلى [تحسين](/tag/تحسين) [تقييم](/tag/تقييم) [كفاءة التعلم](/tag/[كفاءة](/tag/كفاءة)-[التعلم](/tag/التعلم)) في [النماذج اللغوية الكبيرة](/tag/[النماذج](/tag/النماذج)-اللغوية-الكبيرة) ([LLMs](/tag/llms)) في سياق [التصميم](/tag/التصميم) العلمي التكراري. يعتمد الكثير من العمل في [المختبرات](/tag/المختبرات) المستقلة على هذه النماذج، حيث يُعتقد أن فاعليتها في [معالجة المعلومات](/tag/معالجة-[المعلومات](/tag/المعلومات)) وتقديم مخرجات فعالة يمكن أن تُسرع من عملية [التصميم](/tag/التصميم). ومع ذلك، كان [التقييم](/tag/التقييم) التقليدي يركز فقط على النتائج النهائية في نقاط زمنية ثابتة، مما يستثني [تحليل](/tag/تحليل) مسار [التعلم](/tag/التعلم) الفعلي.
ولمعالجة هذه الفجوة، قام الباحثون بتقديم LEAPBench، وهو إطار [عمل](/tag/عمل) يتكون من 55 مهمة تقوم بربط [معايير تقييم](/tag/[معايير](/tag/معايير)-[تقييم](/tag/تقييم)) مسار [التعلم](/tag/التعلم) بكفاءة التعلم، مما يجعل كل تكرار محسوب وسيلة لتوفير التكاليف والوقت. وقد أظهر تطبيق هذا الإطار على ثمانية [نماذج لغوية كبيرة](/tag/[نماذج](/tag/نماذج)-لغوية-كبيرة) أن الانتقال من [تقييم](/tag/تقييم) النتائج النهائية إلى [تقييم](/tag/تقييم) المسارات يغير من [تقييم النموذج](/tag/[تقييم](/tag/تقييم)-النموذج) الأفضل في 53% من المهام، مما يكشف عن مكاسب في [الكفاءة](/tag/الكفاءة) لم يتم [التعرف](/tag/التعرف) عليها سابقاً.
كما كشفت [الدراسة](/tag/الدراسة) أن هذه [النماذج](/tag/النماذج) لم تتفوق على معيار [بايزي](/tag/بايزي) التقليدي. في 16 مهمة في مجال البيولوجيا، أظهرت النتائج أن [التوجيه](/tag/التوجيه) المعتمد على [المعرفة](/tag/المعرفة) بالنطاق أدى إلى اختيارات متطابقة مع [التصميم](/tag/التصميم) الأفضل المنشور بنسبة أقل بمقدار 10 نقاط مئوية مقارنة بالتوجيه العام في الدورة رقم 30.
تحتوي [الدراسة](/tag/الدراسة) أيضاً على دلالة أخرى، حيث يمكن استخدام [معايير تقييم](/tag/[معايير](/tag/معايير)-[تقييم](/tag/تقييم)) المسار كهدف [تدريب](/tag/تدريب) قابل للتطبيق. إذ أظهر [التدريب](/tag/التدريب) الموجه باستخدام [تقنية](/tag/تقنية) [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) تحسناً في [الأداء](/tag/الأداء) على 14 من 21 مهمة محجوزة.
انطلاقًا من هذه النتائج، تبدو [LEAP](/tag/leap) خطوة جديدة في [فهم](/tag/فهم) وعمل [نماذج](/tag/نماذج) الذكاء الاصطناعي، مع التأكيد على أهمية مسار [التعلم](/tag/التعلم) في [تحسين النتائج](/tag/[تحسين](/tag/تحسين)-النتائج) العلمية.
LEAP: كيف تقيم كفاءة التعلم في نماذج الذكاء الاصطناعي لتعزيز التصميم العلمي
تسعى دراسة جديدة إلى تحسين تقييم كفاءة التعلم في النماذج اللغوية الكبيرة (LLMs) من خلال تقديم معايير جديدة. تطور هذا البحث يسلط الضوء على كيفية تحقيق نتائج أفضل بسرعة وكفاءة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
