في عالم الذكاء الاصطناعي، تشهد نماذج اللغة الصغيرة (small Language Models) تطوراً ملحوظاً، مدفوعةً بأبحاث مبتكرة تهدف إلى تحسين أدائها. من بين هذه الابتكارات، تأتي استراتيجية 'التحقق المتكامل مع الأدوات' (Tool-integrated verification) لتكون رائدة في هذا المجال.

العديد من الدراسات أثبتت أن تكبير قدرة الحوسبة في وقت الاختبار يمكن أن يُحسن الأداء بشكل كبير. إلا أن الأبحاث السابقة كانت تركز بشكل كبير على استخدام نماذج أكبر كمدققين، مما ترك مجال التحقق بواسطة نماذج اللغة الصغيرة غير مستكشف بشكل كاف. لذلك، استكشفت دراستنا الجديدة ما إذا كانت هذه النماذج تستطيع التحقق بموثوقية من نتائجها تحت تنفيذ تكبير السعة.

واكتشفنا أن نماذج اللغة الصغيرة، حتى مع استخدامها لتقنيات تكرار المعرفة من المدققين الأكبر، تواجه تحديات في المهام التي تتطلب الذاكرة، مثل الحسابات العددية والتحقق من الحقائق. لمعالجة هذه المشكلة، تم تقديم إطار عمل من طبقتين، يبدأ بتصفية النتائج باستخدام أدوات خارجية، تليها عملية التحقق بواسطة نموذج اللغة الصغيرة، مما يخفف العبء المرتبط بخطوات الذاكرة.

أظهرت التجارب، بما في ذلك الاختبارات على معيار MATH، أن نموذج Llama-3.2 1B وبتطبيق استراتيجية 'التحقق المتكامل مع الأدوات'، حقق نتائج أفضل من نموذج أكبر بكثير هو Llama-3.1 8B. إن هذا التطور لا يعكس فقط قدرات نماذج اللغة الصغيرة، بل يسلط الضوء أيضاً على فائدة تكامل الأدوات لتحسين دقة التحقق.

إن نتائج هذه الدراسة تمثل خطوة مهمة نحو المستقبل، حيث تثبت إمكانية نماذج اللغة الصغيرة في تحقيق الأداء المرجو عند الاستعانة بأدوات متكاملة. لذا، ماذا تنتظر؟ انضم إلى النقاش حول كيفية تغيير مثل هذه الابتكارات لمستقبل الذكاء الاصطناعي!