في عالم الذكاء الاصطناعي، أصبحت الحاجة إلى [تمثيلات](/tag/تمثيلات) [نصوص](/tag/نصوص) قابلة للتفسير (Interpretable Text Representations) أمرًا ملحًا، حيث يطمح الباحثون إلى تقديم [نماذج](/tag/نماذج) دقيقة وذات معنى، بحيث تكون قادرة على الفهم والتدقيق من قبل الجهات المستقلة. على الرغم من أن التمثيلات التمييزية الحالية تعتمد بشكل كبير على اتجاهات غير محددة، فإن طرق مثل مفهوم ‘فُرْعُ المفهوم’ (Concept Bottlenecks) وأساليب مساعدات [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) ([LLMs](/tag/llms)) تستخدم أسماءً طبيعية للميزات دون التأكد من أنها قابلة للتكرار أو متميزة عن العلامة المستهدفة.
تقدم [الدراسة](/tag/الدراسة) معيارًا تشغيليًا جديدًا يتمثل في أن كل بُعد يجب أن يحقق وضوحًا مفهوميًا، يقيس من خلال [توافق](/tag/توافق) عشوائي بين ملاحظات المستقلين الذين يطبقون تعريف الخصائص، وفصل العلامات، مما يعني أنه لا يجب أن تقوم الخاصية ببساطة بإعادة صياغة الهدف التنبئي. يتم [تجسيد](/tag/تجسيد) هذا المعيار في طريقة ‘اكتشاف الميزات المعززة بواسطة LLM’ ([LLM](/tag/llm)-assisted Feature Discovery - LFD)، وهي طريقة تكرارية تقترح [ميزات](/tag/ميزات) لغوية ودلالية من أزواج النصوص المعاكسة للنتائج.
تستخدم LFD عمليات الفحص باستخدام ‘مقياس كوهين’ (Cohen's κ) [عبر](/tag/عبر) [نماذج](/tag/نماذج) [LLM](/tag/llm) متعددة، وتختار الميزات بناءً على الزيادة التنبؤية المحتفظ بها. تعزز التحليلات النمطية الصلة بين شاشة κ وحدود [ضوضاء التسمية](/tag/[ضوضاء](/tag/ضوضاء)-التسمية) لكل ميزة، مما يجعل [التوافق](/tag/التوافق) بمثابة اختبار [موثوقية](/tag/موثوقية). [عبر](/tag/عبر) عشرة مهام [تصنيف](/tag/تصنيف) [نصوص](/tag/نصوص) تغطي سبعة مجاميع بيانات، تتساوى نتائج LFD مع [أداء](/tag/أداء) تنبؤي قوي يعكس الأساس القائم على زجاجة المفهوم (Text Bottleneck)، مع إنتاج [ميزات](/tag/ميزات) أوضح وأقل تداخلًا مع العلامات.
أظهرت [تقييمات](/tag/تقييمات) بشرية بمشاركة 232 مصنفًا أن [ميزات](/tag/ميزات) LFD [تحقق](/tag/تحقق) توافقًا أعلى بين البشر، وكذلك بين البشر ونماذج [اللغات](/tag/اللغات) الضخمة، مما يجعلها خيارات أكثر [موثوقية](/tag/موثوقية) وأقل تسربًا للعلامات.
تقترح هذه النتائج أن الأبعاد المفحوصة بدقة والفصل بين العلامات توفر معيارًا عمليًا لتدقيق [تصنيف النصوص](/tag/[تصنيف](/tag/تصنيف)-النصوص) القابلة للتفسير، مما يعزز دور [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في تقديم [نماذج](/tag/نماذج) دقيقة وفعالة.
اكتشاف النصوص القابلة للتفسير: تمثيلات تمييزية تجمع بين الدقة والفهم
تقدم الدراسة الجديدة معياراً عملياً لتمثيلات النصوص القابلة للتفسير، مع التركيز على القدرة على التدقيق المستقل. توضح النتائج كيف يمكن تعزيز دقة التمثيلات اللغوية عبر استخدام تقنيات جديدة ومفيدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
