تعد عملية تصميم الدوائر التناظرية أحد أبرز التحديات في مجال الأتمتة لتصميم الدوائر الإلكترونية (Electronic Design Automation - EDA). ومع أن نماذج اللغات الضخمة (Large Language Models - LLMs) قد غيّرت المعايير في تطوير البرمجيات، إلا أن استخدامها في تصميم الأجهزة التناظرية كان محاطًا بعقبتين رئيسيتين: عدم توفر قواعد بيانات كافية تصف تصميمات الدوائر بلغة طبيعية، وصعوبة النمذجة بسبب عدم فعالية أدوات تقسيم النصوص العامة مثل Byte Pair Encoding (BPE) في التقاط الهيكل الرسومي للدارات.

لمعالجة هذه التحديات، تم إنشاء أكبر قاعدة بيانات مشروحة لدوائر التناظرية حيث تضم 31,341 زوجًا من وصف الدائرة ولائحتها (netlist). علاوةً على ذلك، تم تقديم Circuit Tokenizer (CKT)، أداة مبتكرة تهدف إلى تشفير الترابط بين الدوائر بشكل أفضل عبر استكشاف الدوائر الفرعية المتكررة.

تتمتع CKT بميزة تنافسية، حيث تتجاوز قيود أدوات التجزئة السابقة من خلال تحقيق نمو ثابت في المفردات بحجم O(1)، الأمر الذي يعزز من Scalability. وبالتالي، أثبتت CKT كفاءتها في تمثيل تركيبات الدوائر، حيث قلّصت طول التسلسل بنسبة 57% وقدمت نسبة ضغط تفوق 2.3 مرة باستخدام مفردات ثابتة.

استنادًا إلى هذه التكنولوجيات المحسنة، تم تدريب نموذج لغة خاص بالدوائر، CircuitFormer، والذي يتمتع ب511 مليون معلمة. وقد أظهر هذا النموذج دقة هيكلية تبلغ 100% ونسبة نجاح وظيفية تصل إلى 83% عبر جميع فئات الدوائر التناظرية الرئيسية، متفوقًا على نماذج LLMs ذات المصدر المفتوح الأخرى بـ10% و14% على التوالي، مع تقليل الحاجة للمعلمات بـ240 مرة.

قامت المجموعة البحثية بإتاحة قاعدة البيانات للجمهور على موقع https://huggingface.co/datasets/touhid314/cktformer-dataset. يتوقع أن تُحدث هذه الابتكارات قفزة نوعية في تصميم الدوائر التناظرية وتفتح آفاق جديدة في هذا المجال.

ما رأيكم في هذه التطورات المذهلة؟ شاركونا في التعليقات.