واليوم، نُسْتَقبِلُ معياراً جديداً يهدف إلى تغيير هذا المشهد: OpenHalDet. يقدم هذا المعيار موحداً لتقييم كشف الأوهام عبر سيناريوهات توليد متنوعة. إذ يوفر OpenHalDet Pipeline قياسياً موحداً، بدءًا من بناء التحفيز وتوليد الاستجابة، إلى التقييم الفعلي للحقائق وتسجيل أداء أدوات الكشف وحساب المعايير.
يعتبر OpenHalDet ملائماً لمجموعة متنوعة من عائلات أدوات الكشف تحت إعدادات وصول مختلفة، بما في ذلك الطرق "الهيكلية السوداء" التي تستخدم فقط المخرجات المولدة، و"الهيكلية الرمادية" التي تعتمد على إشارات احتمالية، و"الهيكلية البيضاء" التي تستفيد من الإشارات الداخلية للنموذج. من خلال إدخال مهام متنوعة ونماذج وأدوات كشف ضمن إطار مشترك، يمكن لـ OpenHalDet أن يسهل المقارنات الدقيقة ويمنح رؤية منهجية حول كيفية تصرف أنماط الكشف المختلفة في تطبيقات LLMs.
لتمكين الابتكار المستدام وتطوير أدوات الكشف عن الأوهام، تم إطلاق OpenHalDet كقاعدة شيفرة مفتوحة وقابلة للتوسع، حيث يمكن لجميع الباحثين والمهتمين الوصول إلى البيانات والشيفرات عبر الرابط: [https://github.com/Nellie179/Hallucination-Detection].
اكتشف OpenHalDet: معيار موحد لكشف الأوهام في نماذج الذكاء الاصطناعي!
يقدم معيار OpenHalDet حلاً موحداً لتحديات كشف الأوهام في نماذج اللغات الكبيرة. بفضل هذا المعيار، يمكن تقييم فعالية أدوات الكشف بشكل أكثر دقة وسهولة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
