في عالم النمو السريع للذكاء الاصطناعي، تواصل النماذج اللغوية القابلة للتشفير (Masked Diffusion Language Models - MDLMs) إثارة الفضول بقدراتها الفائقة في توليد النصوص من الرسوم البيانية. وقد أُجريت مؤخراً أول دراسة منهجية حول هذه النماذج، حيث تناولت تحليل مسارات توليد MDLMs، أي ترتيب استرجاع الكلمات خلال العملية التدريجية لفك التشفير.
تظهر النتائج أن MDLMs تختلف عن النماذج اللغوية التلقائية (Autoregressive Language Models - LLMs) التقليدية من حيث آلية العمل، حيث تُفضل MDLMs استرجاع الكيانات أولاً، تليها الكلمات الوظيفية والعلاقات، بينما تتعامل مع الرموز الهيكلية في المرحلة الأخيرة.
كما تم كشف النقاب عن نمط فشل غير موثق سابقاً يتعلق بالتدريب الخاضع للإشراف (Supervised Fine-Tuning - SFT)، حيث يقوم هذا النوع من التدريب بتثبيت الرموز الهيكلية مبكراً، مما قد يؤدي إلى تناقص طول النص المدخل وصعوبة استرجاع المعلومات، مما يؤدي إلى إغفال عناصر هامة أو حتى إحداث وقائع غير صحيحة.
للتغلب على هذه المشكلات، اقترح الباحثون تعديلًا خاصًا يُعرف بالتحلل الهيكلي الموسع (Lambda-Scaled Structural Decoding)، والذي يقلل من ثقة الرموز الهيكلية، ما يُظهر تحسناً بنسبة 9.4 في قياس BLEU-4.
أيضًا، تم تقديم نموذج جديد يُسمى Graph-LLaDA، والذي يدمج مشفر Transformer إذا جاز التعبير ضمن عملية فك التشفير الخاصة بـ LLaDA، موفراً طريقة صريحة لدمج هيكل الرسوم البيانية.
عند التقييم عبر مجموعات بيانات مختلفة، كشف البحث عن أن النماذج السابقة كانت تميل إلى التكيف مع الأنماط الخاصة ببيانات معينة، بينما أظهرت الأساليب المعتمدة على LLM وMDLM تميزًا ملحوظًا في التعميم.
عندما نتحدث عن تقدمات ذلك المستوى، يصبح لدينا أمل جديد في كيفية الاستفادة من هذه التقنيات في المستقبل. كيف تصورون أن يؤثر هذا التطور على مجال الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات.
كسر الحواجز: فهم النماذج اللغوية القابلة للتشفير وكيفية تحسين توليد النصوص من الرسوم البيانية
اكتشافات مثيرة تتعلق بالنماذج اللغوية القابلة للتشفير (MDLMs) في توليد النصوص من الرسوم البيانية، حيث تقدم هذه الدراسة رؤى جديدة حول ترتيب استرجاع الكلمات وإمكانية تحسين النتائج. انضم إلينا لفهم كيف ردت هذه النماذج على تحديات التوليد.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
