في عالم برمجة الكم، تزداد التعقيدات يوماً بعد يوم، مما يكشف عن القيود الخطيرة للنماذج القائمة على الذكاء الاصطناعي. فقد أثبتت النماذج العامة مثل نماذج اللغة الكبيرة (LLM) أنها تعاني من مشاكل مثل عدم القدرة على التعرف على أسماء الأبواب الخاصة بـ PennyLane، أو سوء تكوين الأجهزة، أو إنتاج دوائر غير صحيحة هيكليًا عند مواجهة تحديات برمجية متخصصة.

تقديمنا هنا لـ PennySynth يمثل خطوة رائدة في معالجة هذه المشاكل. يعتمد هذا الإطار الجديد، المدعوم بتقنية استرجاع مُعزَّزة (Retrieval-Augmented Generation)، على قاعدة بيانات مُنسَّقة تضم أكثر من 13,389 زوجًا من تعليمات أكواد PennyLane، تم بناؤها من خلال أسلوب استخراج وتحقق وتنقيح مُفصَّل عبر مستودعات PennyLane الرسمية ومصادر GitHub المجتمعية وأرشيفات مسابقة QHack.

يستخدم PennySynth استراتيجية تضمين واعية بالأكواد تعتمد على نموذج st-codesearch-distilroberta-base، المصمم لاسترجاع النص الطبيعي إلى الأكواد، مما أدى إلى زيادة معدل التشابه في الاسترجاع من 0.45 إلى 0.726 مقارنةً بالنموذج العام.

تم تقييم الأداء عبر 74 تحدي على مدى ثلاث سنوات من مسابقة QHack، حيث حققت PennySynth معدلات نجاح بلغت 64% و68% و52% في أعوام 2022 و2023 و2024 على التوالي، مما يمثل تحسنًا ملحوظًا بنسبة تتجاوز 28 نقطة مئوية مقارنةً بالنموذج المنافس Claude Sonnet 4.6.

كما تم تقديم مقياس CodeBLEU المعدل ليتناسب مع الكم، والذي يقوم بزيادة أهمية الأنماط qml.*، مُظهرًا أن جودة الأكواد الكمومية تعتمد على جوانب مختلفة مثل التشابه الهيكلي وصحة الوظيفة. وكشفت التجارب أن تضمينات الأكواد الواعية هي المحرك الأساسي لأداء الاسترجاع، بينما يوفر توسيع قاعدة البيانات وتنوع المصادر فوائد إضافية عند توفر جودة استرجاع دقيقة.