تواجه نماذج اللغات الكبيرة (Large Language Models) تحديات بارزة عندما يتعلق الأمر بالتعامل مع المعرفة غير المتاحة. بدلاً من التصريح بعدم المعرفة، غالبًا ما تقدم هذه النماذج إجابات سلسة لكنها غير صحيحة. في هذا السياق، يُعرض الآن مفهوم جديد يحمل عنوان **شهادات الجهل المنظم** (Structured Ignorance Certificates - SICs)؛ وهو نموذج تنسيق إخراج بصيغة JSON يُلزم النموذج بتحديد الفجوات المعرفية، وتعداد المفاهيم المطلوبة، وتقديم استعلام استرجاعي بناء بدلاً من التوهّم بالإجابات.

لتحسين جودة هذه الشهادات، قام الباحثون بتطوير مجموعة بيانات تتكون من 7,347 عينة تحت عنوان **المجهول غير المعلوم** (Unknown-Unknown - UU)، حيث تم تحفيز النموذج Qwen3-14B لخلق أسئلة تتمحور حول سبعة مجالات مختلفة (مثل الفيزياء، علم الأحياء، الهندسة، علوم الحاسوب، الاقتصاد، الطب، والقانون) في استعلامات جديدة عابرة لمجالات المعرفة، مما جعلها أسئلة صعبة لا يمكن لنموذج خبير في مجال واحد الإجابة عليها.

تم تحسين نموذج يحتوي على 14 مليار معلم باستخدام تحسين السياسة النسبي الجماعي (Group Relative Policy Optimization - GRPO)، معتمدًا على مكافأة مركبة تجمع بين فائدة الاسترجاع، وخصوصية المفاهيم، وصحة صيغة الإخراج. ومع توافر أداة فحص تتعلق بالتباين في إعادة الصياغة، تم التأكيد على أن النتائج المعدلة باستخدام SIC تُظهر بشكل منهجي درجات أعلى في احتمال المجهول غير المعلوم.

عند تقييم النموذج على 735 سؤالًا من فئة UU، حقق نموذج SIC نسبة صلاحية JSON تبلغ 99.46%، ودرجة خصوصية الشهادة متوسطها 0.967، بالإضافة لتحسين بنسبة 3.6% في قياس ROUGE-L مقارنةً بالنموذج الأساسي، مما يدل على أن الهيكلة المعرفية الصريحة تعد قدرة قابلة للتعلم والقياس.

إذا كنت تتساءل عن مستقبل نماذج الذكاء الاصطناعي وكيف يمكن تحسين معرفتها، فماذا تنتظر؟ شاركنا أفكارك في التعليقات.