تسارعت وتيرة استخدام نماذج اللغات (Large Language Models) في العديد من التطبيقات حيث يتعين على المخرجات المولَّدة الامتثال لمجموعة من القيود الدلالية أو النحوية الصارمة. تعكس الطرق التقليدية المستخدمة في هذا السياق مدى الصعوبة في تحقيق التوازن بين جودة المخرجات والإخفاق في القيود المضافة. من بين هذه الطرق، نجد أسلوب التشفير المحسوب (Greedy Constrained Decoding) الذي يفرض صعوبة كبيرة على نموذج اللغة، مما يؤدي إلى تشويه توزيعاته، أو طريقة العينات المرفوضة (Rejection Sampling) التي تحافظ على جودة النتائج لكنها تتسبب في إهدار الموارد عبر تجاهل المخرجات غير الصالحة.

هنا يأتي دور تقنية العينات المرفوضة المتكيفة (Constrained Adaptive Rejection Sampling - CARS) التي تقدم حلاً مبتكرًا للتحديات المذكورة من خلال تحسين كفاءة العينات بدون تشويه التوزيع. تبدأ هذه التقنية بأخذ عينات من نموذج اللغة دون قيود، ثم تقوم بشكل ديناميكي باستبعاد المخرجات التي لا تتفق مع المعايير المحددة. يتم ذلك بتسجيل هذه المخرجات في هيكل بيانات يسمى "الشجرة" (Trie)، حيث يتم حذف مجموع احتمالياتها من السحبات المستقبلية. تسمح هذه العملية التكيفية بتجنب إعادة معالجة المقدمات التي تم إثبات عدم صحتها، مما يعزز من معدلات قبول النتائج وينتج عينة تتبع توزيع القيود بشكل دقيق.

عند اختبار تقنية CARS في مجالات متعددة مثل توليد البرامج والتوليف الجزيئي، أثبتت هذه التقنية تفوقها من حيث الكفاءة، حيث تميزت بعدد أقل من دورات النقاط للأمام لكل عينة صالحة. وتظهر التجارب نتائج ملحوظة فيما يتعلق بتنوع العينات، مما يجعل CARS الخيار الأمثل للمشاريع التي تتطلب دقة وابتكارًا في الوقت ذاته.