تتزايد استخدامات نماذج اللغة العميقة (DLMs) في مجالات حيوية مثل الرعاية الصحية، مما يجعل فهم كيفية اتخاذها للقرارات أمراً بالغ الأهمية لضمان ثقة المستخدمين وسلامتهم. يعد هذا التحدي معقداً بشكل خاص عندما تعمل هذه النماذج كنظُم سوداء (Black-Box)، حيث تكون الوصول إلى حالات النموذج الداخلية محدوداً. على الرغم من الجهود الكثيرة المبذولة، فإن طرق الشرح الحالية غالباً ما تفشل في تلبية ثلاثة متطلبات رئيسية: فعالية استنتاجية في الوقت الفعلي، توافق مع النظم السوداء دون إثارة سلوكيات غير متوقعة، وشرحات مفهومة مستندة إلى البنية اللغوية للمدخلات.
للتغلب على هذه التحديات، نقدم طريقة جديدة تشرح توقعات DLMs عن طريق اختيار مجموعة صغيرة من الكلمات المدروسة. نضع هذا في صيغة مشكلة تحسين مستندة، مما يتيح استنتاجاً فعالاً لمرة واحدة دون الحاجة إلى بحث خاص بالمدخلات. تٌدرَّب سياستنا الانتقائية عبر تدرجات السياسة بأسلوب REINFORCE، مما يسمح باختيار الكلمات بشكل منفصل في بيئة خالية من التدرجات.
لزيادة قابلية التفسير ومواءمتها مع الفهم اللغوي البشري، ندمج المعرفة المعمارية في عملية الاختيار هذه، مما يعزز من مجموعات الكلمات المتماسكة لغوياً ويؤدي إلى تفسيرات غنية بالمعلومات ومعنوية للمستخدمين النهائيين.
قمنا بتقييم طريقتنا على معماريات DLMs متنوعة والعديد من مجموعات البيانات الواقعية. وقد أثبتت قدرتها على تحديد مجموعات الكلمات التي تمتلك قدرة تمييز محسَّنة وتوافق أقوى مع الإشارات اللغوية، متفوقة بذلك على الطرق التقليدية المتوافقة مع الأنظمة السوداء وطرق تعتمد على التدرجات التي تُعطى الوصول إلى تدرجات النموذج السوداء لتحدٍ أكثر صعوبة. تجدون كود هذه الطريقة متاحًا هنا.
نموذج اللغة الأسود: كيف نسمح لفهم آليات الذكاء الاصطناعي المعقدة؟
تقة المستخدمين في نماذج اللغة العميقة (DLMs) ضرورية، لكن فهم أسباب اتخاذها للقرارات يعد تحدياً معقداً. نحن نقدم طريقة مبتكرة لتحسين مستوى الشفافية والموثوقية من خلال اختيار كلمات مدروسة تشرح التوقعات بدقة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
