في عالم [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) (Large Language [Models](/tag/models))، تظل القدرة على [التفكير](/tag/التفكير) والتذكر من الجوانب التي تثير العديد من التساؤلات. فبينما تبرز هذه [النماذج](/tag/النماذج) قدرات مذهلة، يبقى السؤال: هل تعكس هذه القدرات تذكرًا متقنًا أم قدرة عميقة على [التفكير](/tag/التفكير)؟ في محاولة لفهم هذا الأمر بشكل أفضل، تم استخدام [الشطرنج](/tag/الشطرنج) كنموذج اختبار للتحقق من هذه الجوانب.
تقوم [الدراسة](/tag/الدراسة) بإنشاء [تصنيف](/tag/تصنيف) موضعي متنوع يعتمد على هيكل [الشطرنج](/tag/الشطرنج) واختبارات محرك اللعبة القابلة للتوسع، حيث يتم [تصنيف](/tag/تصنيف) الأوضاع وفقًا لكثافة [المعلومات](/tag/المعلومات) السابقة المرتبطة. تتراوح هذه الأوضاع بين حالات شائعة يمكن حلها عن طريق التذكر إلى حالات جديدة تمامًا تتطلب [التفكير](/tag/التفكير) والاستنتاج.
بالاعتماد على هذه التصنيفات، أجرينا تحليلاً طويلاً لنماذج [GPT](/tag/gpt) بالإضافة إلى [تقييم دقيق](/tag/[تقييم](/tag/تقييم)-دقيق) للنماذج المعاصرة مثل [Claude](/tag/claude) Opus وGemini. يكشف [التحليل](/tag/التحليل) عن وجود تدرج حاد: فكلما قلت [كثافة المعلومات](/tag/كثافة-[المعلومات](/tag/المعلومات)) السابقة، تتدهور [الأداء](/tag/الأداء) بشكل مستمر، وفي المهام التي تحتوي على هذه [المعلومات](/tag/المعلومات) الضعيفة، تستعيد [نماذج](/tag/نماذج) القاعدة أدائها التقليدي الذي يقترب من اللعب العشوائي.
قد تكون [النماذج](/tag/النماذج) الأحدث أفضل، لكن التقدم يصبح بطيئًا في المهام التي تتطلب القليل من [المعلومات](/tag/المعلومات) السابقة. كما تشير النتائج إلى أن [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) من خلال [الاستنتاج](/tag/الاستنتاج) المعزز يعني أن الفوائد النسبية لكل عنصر تتضاءل عندما تكون [المعلومات](/tag/المعلومات) السابقة غير متوفرة. كل ذلك يشير إلى وجود [قيود](/tag/قيود) في قدرة [النماذج](/tag/النماذج) على [التعميم](/tag/التعميم) المنهجي، مما يؤكد الحاجة إلى [آليات](/tag/آليات) تتجاوز مجرد [التوسع](/tag/التوسع) لتحسين [الأداء](/tag/الأداء) عندما تفتقر إلى [المعلومات](/tag/المعلومات) السابقة ذات الصلة.
فما رأيكم في هذه النتائج الجديدة؟ هل تعتقدون أن [نماذج الذكاء الاصطناعي](/tag/[نماذج](/tag/نماذج)-الذكاء-الاصطناعي) يمكن أن تتجاوز هذه [القيود](/tag/القيود) في المستقبل؟ شاركونا في [التعليقات](/tag/التعليقات).
تحليل التفكيك: هل هي ذاكرة أم تفكير فعلي في نماذج اللغة الضخمة عند اللعب بالشطرنج؟
تقدم الدراسة الجديدة استخدام لعبة الشطرنج لفهم الاختلاف بين الذاكرة والتفكير في نماذج اللغة الضخمة. نتائج البحث تكشف عن حدود في قدرة هذه النماذج على التعميم دون الاعتماد على معلومات مسبقة مرتبطة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
