في عالم سريع التطور من الذكاء الاصطناعي، يُعد PhyDrawGen ثورة حقيقية في كيفية توليد الرسوم البيانية الفيزيائية من اللغة الطبيعية. يتطلب توليد هذه الرسوم التزامًا صارمًا بالقوانين الفيزيائية، ما يجعل المهمة معقدة جدًا بالنظر إلى أن النماذج الحالية تميل إلى إنتاج outputs بصرية تبدو صحيحة ولكنها غالبًا ما تنحرف عن القوانين الفيزيائية.
PhyDrawGen هو نظام مبتكر يعتمد على تقنية neuro-symbolic (العصبي الرمزي) التي تفصل بين فهم المشهد الدلالي (semantic scene understanding) وتحقيق القيود الفيزيائية (physical constraint satisfaction). كيف يتم ذلك؟ الأمر يبدأ مع نموذج كبير للغة (Large Language Model) يستخرج مخطط مشهد محدد من النص. بعد ذلك، يتولى حلول دائمة تحويل هذا المخطط إلى Graph خطي مستوي (Planar Straight-Line Graph) يعكس توازن القوى، والمسارات البصرية، وخصائص الحقول ككائنات هندسية دقيقة.
وفي المرحلة النهائية، يتم استخدام نموذج Qwen-VL المُخصص لتطبيق حلقة اقتراح-تحقق بصرية لتصحيح أي انتهاكات للقيود بشكل تكراري. تمت اختباره على مجموعة مرجعية تحتوي على 1,449 مسألة تغطي مجالات الديناميكا، والبصريات، والكهرومغناطيسية، حيث أظهر PhyDrawGen تفوقاً ملحوظاً على نماذج مثل GPT-5-image وGemini 2.5 Flash وGemini 3 Pro. إن الأداء القوي لدقة الفيزياء حتى مع المشكلات التي تتعلق بأجسام غير اعتيادية يفتح آفاقًا جديدة في هذا المجال.
PhyDrawGen: ثورة في توليد الرسوم البيانية الفيزيائية من اللغة الطبيعية!
تمثل PhyDrawGen تطوراً مهماً في مجال توليد الرسوم البيانية الفيزيائية، حيث تعتمد على نموذج عصبي يضمن التزام دقيق بالقوانين الفيزيائية. هذه التقنية تتفوق على النماذج الحالية في الدقة والموثوقية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
