في عالم الذكاء الاصطناعي، تبرز نماذج اللغات الضخمة (LLMs) كنقطة تحول تؤثر بشكل كبير على كيفية تفاعلنا مع التقنيات الحديثة. ومع ذلك، قد لا تكون المعايير الحالية كافية لقياس الكفاءة في تحويل النوايا اللغوية الطبيعية إلى معاملات دقيقة تعتمد على حالة الشبكة. لذا تم تقديم "Intent2Tx" كمعيار مبتكر يعد الأول من نوعه.

يتميز "Intent2Tx" بمجموعته الشاملة التي تشمل 29,921 حالة ذات خطوة واحدة و1,575 حالة متعددة الخطوات، مشتقة بعناية من 300 يوم من بيانات شبكة Ethereum. على عكس العديد من الأبحاث السابقة التي تعتمد على تعليمات مصنوعة، يركز "Intent2Tx" على النوايا اللغوية في سياقها الحقيقي، مشتملاً على 11 فئة مختلفة، بما في ذلك مجموعة متنوعة من العناصر الأساسية للتمويل اللامركزي (DeFi).

تم تصميم إطار العمل الخاص به لتقييم دقيق، متجاوزاً التحليل السطحي للغة عن طريق استخدام تحليل الحالات المتفاضة في بيئات الرئيسية المنقسمة. تشير تقييماتنا الواسعة لـ 16 نموذج LLM حديث إلى أن تحسين السعة واسترجاع المعلومات يعزز من الاتساق المنطقي، بيد أن العوائق لا تزال قائمة عندما يتعلق الأمر بالتعميم خارج النطاق والتخطيط متعدد الخطوات.

الأكثر أهمية، تُظهر تحليلاتنا القائمة على التنفيذ أن المخرجات الصحيحة من الناحية النحوية غالباً ما تفشل في تحقيق الانتقال المطلوب بين الحالات، مما يبرز فجوة كبيرة في قدرات "الاستدلال إلى التنفيذ" الحالية. يُعتبر "Intent2Tx" أساسياً في تطوير وكلاء ذات طابع مستقل وموثوق في بيئات الويب 3 التي تعتمد على النوايا.