في عالم الذكاء الاصطناعي، يعتبر تحسين التعليمات (Prompt Optimization) من أبرز التحديات التي تواجه الباحثين والمطورين في نماذج اللغات الكبيرة (Large Language Models). فقد تمكنت تقنية تحسين التعليمات التلقائي (Automatic Prompt Optimization - APO) من تحقيق مكاسب كبيرة في سير العمل المعتمد على النماذج اللغوية، ولكن الأساليب الحالية لا تزال تعاني من بعض القيود.

تتنوع الطرق التقليدية في تحسين التعليمات في تعاملها مع كل مهمة، حيث يتم استخدام سلاسل ثابتة غير قابلة للتخصيص، مما يؤدي إلى تحديثات ضعيفة وبالتالي صعوبة في إعادة استخدام السلوكيات التعلمية المُكتسبة.

لكن الآن، قدم الباحثون تقنية جديدة تُعرف باسم Prompt Codebooks (PCO)، وهي إطار عمل مبتكر يهدف إلى إعادة صياغة تحسين التعليمات في شكل تعلم منفصل مستند إلى مفردات محدودة من ردود الفعل اللغوية الطبيعية. تعتمد هذه الطريقة على تنظيم معرفات إنشاء التعليمات في كود بوك منفصل، حيث يتيح لكل مدخل التوجيه إلى مجموعة صغيرة من المدخلات بواسطة مُشفر قائم على نموذج لغوي.

يجمع مولد التعليمات هذه المدخلات لتشكيل تعليمات مخصصة للنموذج المستهدف، بينما يُصدر المُقيّم حكمًا منظمًا يُحلل تأثير التعليمات على المتغيرات النصية. يرى الباحثون أن هذا الاتجاه يسمح بتوجيه التعليمات بشكل محدد لكل حالة، حيث يمكن لمدخلات مختلفة ضمن نفس المهمة أن تتلقى تركيبات تعليمات فريدة، وهو أمر غير قابل للتعبير عنه باستخدام الأساليب التقليدية.

عند اختبار PCO عبر ست معايير أداء على نماذج Qwen3-8B وLLaMA-3.1-8B، أثبتت التقنية تحسينات ملحوظة تصل إلى 30.36 نقطة مقارنة بالأساليب السابقة، متفوقةً على أفضل معيار سابق (GEPA) في اختبار HotpotQA، وتقليل طول التعليمات المُعتمدة حتى 14.1 مرة مقارنة بأسلوب MIPROv2.

إن هذا الابتكار لا يقدم فقط وسيلة لتحسين أداء النماذج اللغوية ولكنه يبشر بثورة في كيفية تقديم التعليمات، مما يجعل عملية التعلم أكثر مرونة وقوة.

ما رأيكم في هذا التطور الثوري في مجال الذكاء الاصطناعي؟ شاركونا في التعليقات.