يتجاوز الفهم التقليدي لنماذج [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) الحاجة إلى مقارنة مجرد الشروحات؛ حيث يفترض أن [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) متعددة السلوكيات، وتتأثر بالتدخلات مثل الضبط الدقيق (Fine-tuning) أو [التعلم التعزيزي](/tag/[التعلم](/tag/التعلم)-التعزيزي) بواسطة [التغذية الراجعة](/tag/[التغذية](/tag/التغذية)-الراجعة) من البشر ([Reinforcement Learning](/tag/reinforcement-learning) with Human Feedback).
من الواضح أن الأساليب الحالية في الشرح غير كافية؛ لأنها تعالج [النماذج](/tag/النماذج) ككيانات ثابتة أو تقارن التفسيرات بشكل منفصل [عبر](/tag/عبر) نقاط زمنية متتالية دون ارتباط يشرح الانتقال الوظيفي بين حالتين. هذه [الفجوة](/tag/الفجوة) تطرح [مخاطر](/tag/مخاطر) حكومية كبيرة [عبر](/tag/عبر) مناطق عدة، بما في ذلك [قانون الذكاء الاصطناعي](/tag/[قانون](/tag/قانون)-الذكاء-الاصطناعي) في [الاتحاد الأوروبي](/tag/الاتحاد-الأوروبي) ([EU [AI](/tag/ai) Act](/tag/eu-ai-act)) وتشريعات الولايات الأمريكية ولوائح [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في [الصين](/tag/الصين)؛ نظرًا لأنها تتطلب [توثيق](/tag/توثيق) سلسلة [سببية](/tag/سببية) للتعديلات الكبيرة في النظام.
لذا، تدعو هذه الورقة البحثية إلى ضرورة توضيف نهج واحد يقوم على أهمية [تفسير](/tag/تفسير) التحولات السلوكية في [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة). يتوجب أن تقوم هذه المقاربة على [تفسير](/tag/تفسير) كيف ولماذا تؤدي التدخلات إلى [تحول](/tag/تحول) النموذج الأساسي إلى [نموذج](/tag/نموذج) مُحدّث يتبنى سلوكًا مختلفًا تمامًا.
نقدم أيضًا [رؤية](/tag/رؤية) جديدة تُعرف باسم '[تفسير](/tag/تفسير) المقارنة' (Comparative XAI)، حيث تسعى هذه المقاربة لتفسير الفروقات بين حالتين مختلفتين من النموذج حيث كان هناك [تحول](/tag/تحول) سلوكي ملحوظ. كما تأتي مع مجموعة من الشروط والمطالب التي ينبغي أن تحققها عمليات الشرح، مثل القابلية للمقارنة، الصلاحية، القابلية للتنفيذ، والمتابعة، بهدف إرساء أساسيات [تدقيق النماذج](/tag/[تدقيق](/tag/تدقيق)-[النماذج](/tag/النماذج)) في متطلبات واضحة وقابلة للقياس.
[الأدلة](/tag/الأدلة) الأولية تشير بقوة إلى الحاجة لهذا النوع من النهج في [التطبيقات](/tag/التطبيقات) العملية، وذلك من خلال [تجارب](/tag/تجارب) توضيحية وجمع النتائج في تقرير انتقال يمكن استخدامه مباشرةً في [وثائق](/tag/وثائق) [الحوكمة](/tag/الحوكمة) والحوادث.
من الضروري فهم التغيرات: معايير جديدة لشرح التحولات السلوكية في نماذج اللغات الضخمة
تقدم هذه الورقة فكرة ثورية حول طريقة تفسير التحولات السلوكية في نماذج اللغات الضخمة، مقترحةً معايير جديدة تركز على تغيير السلوك نفسه. المستقبل يتطلب فهمًا أعمق للتدخلات وتأثيرها على نماذج الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
