في عالم التعلم الآلي، تكتسب نمذجة السياقات الطويلة أهمية متزايدة، حيث تستلزم ضرورة تفاعل الذكاء الاصطناعي مع كميات ضخمة من البيانات.

لكن، ماذا لو استطعنا تقديم طريقة جديدة لمواجهة التحديات المتعلقة بفهم السياقات الطويلة وتعقيدات العلاقات بين الكيانات؟

تقدم تقنية جديدة باسم KGERMAR (Knowledge Graph Enhanced Memory-Augmented Retrieval) حلاً مبتكرًا. هذه التقنية لا تقتصر على توسيع نوافذ السياق، بل تعزز الفهم المتماسك لحالات الكيانات وعلاقاتها عبر الآلاف من الرموز (tokens).

الجديد هنا هو بناء رسوم بيانية معرفية ديناميكية ومخصصة لسياق معين من النص المدخل خلال عملية الاستنتاج. مما يمكّن استرجاع البيانات بشكل يتناسب مع المجال ويعتمد على كلاً من التشابه الدلالي والعلاقات الصريحة بين الكيانات.

تتمثل بنية KGERMAR في استخراج الكيانات والعلاقات في الوقت الحقيقي، مما يسمح ببناء رسوم بيانية معرفية سياقية. ثم يتم دمج الانغماسات الهيكلية للرسوم البيانية مع المعاني النصية من خلال بنية ذاكرة متعددة المكونات.

تتضمن هذه البنية ثلاث بنوك ذاكرة: سياقية، دلالية، وهيكلية، حيث يتم دمج إشارات الاسترجاع عبر أوزان متعلمة لالتقاط كل من المعاني السطحية والأنماط العميقة للعلاقات.

عند تقييم KGERMAR على مجموعات بيانات مثل SlimPajama وWikiText-103 وPG-19 وProof-pile، أثبتت التقنية كفاءتها في تقليل الأدهشة بنسبة تصل إلى 8.5% وتحسين فعالية الذاكرة من 2 إلى 2.5 ضعف مقارنة بطرق ذاكرة تقليدية عبر سياقات بطول من 1K إلى 32K رمز.

تعد هذه المقاربة المتقدمة لبناء الرسوم البيانية المعرفية خطوة هامة نحو تحسين نمذجة اللغات المعززة بالذاكرة، مما يمكّن تمثيل المعرفة المرتبطة بالمجال الذي يتكيف مع سياقات المدخلات بدلاً من الاعتماد على قواعد بيانات ثابتة.

بهذا، نكون قد استعرضنا أحدث مستجدات استعمال الذكاء الاصطناعي في نمذجة السياقات الطويلة. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.