في عالم يتجه [نحو](/tag/نحو) الاعتماد المتزايد على [نماذج](/tag/نماذج) الذكاء الاصطناعي، قدم [فريق](/tag/فريق) بحثي [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) تحت عنوان LEAP، والتي تهدف إلى [تحسين](/tag/تحسين) [تقييم](/tag/تقييم) [كفاءة التعلم](/tag/[كفاءة](/tag/كفاءة)-[التعلم](/tag/التعلم)) في [النماذج اللغوية الكبيرة](/tag/[النماذج](/tag/النماذج)-اللغوية-الكبيرة) ([LLMs](/tag/llms)) في سياق [التصميم](/tag/التصميم) العلمي التكراري. يعتمد الكثير من العمل في [المختبرات](/tag/المختبرات) المستقلة على هذه النماذج، حيث يُعتقد أن فاعليتها في [معالجة المعلومات](/tag/معالجة-[المعلومات](/tag/المعلومات)) وتقديم مخرجات فعالة يمكن أن تُسرع من عملية [التصميم](/tag/التصميم). ومع ذلك، كان [التقييم](/tag/التقييم) التقليدي يركز فقط على النتائج النهائية في نقاط زمنية ثابتة، مما يستثني [تحليل](/tag/تحليل) مسار [التعلم](/tag/التعلم) الفعلي.

ولمعالجة هذه الفجوة، قام الباحثون بتقديم LEAPBench، وهو إطار [عمل](/tag/عمل) يتكون من 55 مهمة تقوم بربط [معايير تقييم](/tag/[معايير](/tag/معايير)-[تقييم](/tag/تقييم)) مسار [التعلم](/tag/التعلم) بكفاءة التعلم، مما يجعل كل تكرار محسوب وسيلة لتوفير التكاليف والوقت. وقد أظهر تطبيق هذا الإطار على ثمانية [نماذج لغوية كبيرة](/tag/[نماذج](/tag/نماذج)-لغوية-كبيرة) أن الانتقال من [تقييم](/tag/تقييم) النتائج النهائية إلى [تقييم](/tag/تقييم) المسارات يغير من [تقييم النموذج](/tag/[تقييم](/tag/تقييم)-النموذج) الأفضل في 53% من المهام، مما يكشف عن مكاسب في [الكفاءة](/tag/الكفاءة) لم يتم [التعرف](/tag/التعرف) عليها سابقاً.

كما كشفت [الدراسة](/tag/الدراسة) أن هذه [النماذج](/tag/النماذج) لم تتفوق على معيار [بايزي](/tag/بايزي) التقليدي. في 16 مهمة في مجال البيولوجيا، أظهرت النتائج أن [التوجيه](/tag/التوجيه) المعتمد على [المعرفة](/tag/المعرفة) بالنطاق أدى إلى اختيارات متطابقة مع [التصميم](/tag/التصميم) الأفضل المنشور بنسبة أقل بمقدار 10 نقاط مئوية مقارنة بالتوجيه العام في الدورة رقم 30.

تحتوي [الدراسة](/tag/الدراسة) أيضاً على دلالة أخرى، حيث يمكن استخدام [معايير تقييم](/tag/[معايير](/tag/معايير)-[تقييم](/tag/تقييم)) المسار كهدف [تدريب](/tag/تدريب) قابل للتطبيق. إذ أظهر [التدريب](/tag/التدريب) الموجه باستخدام [تقنية](/tag/تقنية) [التعلم المعزز](/tag/[التعلم](/tag/التعلم)-المعزز) تحسناً في [الأداء](/tag/الأداء) على 14 من 21 مهمة محجوزة.
انطلاقًا من هذه النتائج، تبدو [LEAP](/tag/leap) خطوة جديدة في [فهم](/tag/فهم) وعمل [نماذج](/tag/نماذج) الذكاء الاصطناعي، مع التأكيد على أهمية مسار [التعلم](/tag/التعلم) في [تحسين النتائج](/tag/[تحسين](/tag/تحسين)-النتائج) العلمية.