في عالم الذكاء الاصطناعي، يعتبر [توافق](/tag/توافق) [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) ([LLMs](/tag/llms)) مع الأحكام البشرية من القضايا الجوهرية التي تحتاج إلى [حلول مبتكرة](/tag/[حلول](/tag/حلول)-مبتكرة). في هذا السياق، قدم الباحثون [دراسة](/tag/دراسة) مثيرة تتمحور حول إطار لاختبار الفرضيات، حيث يهدف إلى ضمان [التوافق](/tag/التوافق) بين الأحكام التي تصدرها [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) وتلك التي يصدرها البشر.
يعتمد هذا الإطار على الفرضية القائلة بأن [تقدير الثقة](/tag/تقدير-[الثقة](/tag/الثقة)) من قبل النموذج يجب أن يكون متسقًا مع [مخاطر](/tag/مخاطر) عدم الاتفاق مع الأحكام البشرية. لكن، في الواقع، قد يحدث انتهاك لهذه الفرضية، مما يستدعي الحاجة لتحليل [سلوك](/tag/سلوك) [تقدير الثقة](/tag/تقدير-[الثقة](/tag/الثقة)) بشكل أدق. هنا يأتي دور المصنف الخاص بالثقة كمبدع في تقديم حل.
يتجاوز [البحث](/tag/البحث) الاعتماد على [إشارات](/tag/إشارات) [الثقة](/tag/الثقة) الارتجالية، ويعتمد بدلاً من ذلك على [تعلم](/tag/تعلم) مصنف [ثقة](/tag/ثقة) مخصص. يستفيد أسلوبهم من [تنوع](/tag/تنوع) المراجعين المحاكي وصياغة [تصنيف](/tag/تصنيف) قائمة على الهامش، وذلك لتصميم [نموذج](/tag/نموذج) يوضح مدى [ثقة](/tag/ثقة) النموذج في التفريق بين الحالات التي تتفق فيها الأحكام البشرية وتلك التي لا تتفق.
علاوة على ذلك، قام الباحثون بمشتقة ضمانات [تعميم](/tag/تعميم) لهذا المصنف، مما يكشف عن مقايضة تعتمد على الهامش تُساهم في [تحسين](/tag/تحسين) إجراء [تدريب](/tag/تدريب) المصنف التكيفي. وبدمج هذا المصنف المتعلم في الاختبارات التسلسلية الثابتة، تم [تحسين](/tag/تحسين) [دقة](/tag/دقة) [التصنيف](/tag/التصنيف) وتعزيز العلاقة المتزايدة بين [الثقة](/tag/الثقة) ومخاطر عدم الاتفاق، مما يؤدي إلى ارتفاع معدلات النجاح في الوصول إلى مستويات الاتفاق المستهدفة [عبر](/tag/عبر) مجموعة متنوعة من [البيانات](/tag/البيانات) ونماذج القضاة.
تعد هذه النتائج خطوة كبيرة [نحو](/tag/نحو) تعزيز [موثوقية](/tag/موثوقية) [تطبيقات الذكاء الاصطناعي](/tag/[تطبيقات](/tag/تطبيقات)-الذكاء-الاصطناعي) في مجال إصدار الأحكام، مما يفتح آفاق جديدة للتفاعل الإيجابي بين البشر ونماذج [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي).
تصنيف الثقة القائم على الهامش: خطوة نحو أحكام دقيقة من نماذج اللغات الضخمة
تقدم دراسة جديدة إطارًا لاختبار الفرضيات يضمن توافق نماذج اللغات الضخمة مع الأحكام البشرية. من خلال تعلم مصنف ثقة مخصص، تعزز هذه الطريقة دقة التصنيف وتحسن معدلات نجاح الاتفاق المستهدف.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
