تتسارع استخدامات [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) في مجالات [التفاعل](/tag/التفاعل) بين الإنسان والذكاء الاصطناعي، لكن الكثير من الدراسات الحالية تركز على القدرات والمعايير الأمنية دون أن تكشف الكثير عن أولويات القيم التي تعبر عنها هذه الأنظمة.
في [دراسة](/tag/دراسة) حديثة، تم تقديم نهج يعتمد على [تحليل](/tag/تحليل) المخرجات لتقييم جانب واحد من جوانب [توافق](/tag/توافق) الذكاء الاصطناعي، حيث تم اعتبار النصوص التي تنتجها [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) بمثابة [بيانات](/tag/بيانات) سلوكية تتم مقارنتها مع مرجع بشري.
شملت [الدراسة](/tag/الدراسة) ثلاث مراحل رئيسية:
- **المرحلة الأولى**: استخدمت تحليلًا نوعيًا استقرائيًا لاستنتاج ستة موضوعات تتعلق بوظائف [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) المثلى، وهي الأداء، والقدرة التكيفية، والخير الاجتماعي، والأخلاق والمسؤولية، والتكامل العلاقي، والوكالة.
- **المرحلة الثانية**: أظهرت أن مخرجات [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) كانت مستقرة للغاية داخل [النماذج](/tag/النماذج) واتفقت على هيكل [قيمة](/tag/قيمة) أولوياته [عبر](/tag/عبر) النماذج، مما يشير إلى [موثوقية](/tag/موثوقية) وقابلية المقارنة بين ملفات القيم.
- **المرحلة الثالثة**: تم [تقييم](/tag/تقييم) 75 نموذجًا معاصرًا للغات ضد 376 مشاركًا بشريًا باستخدام مقياس يُركز على [دقة](/tag/دقة) الملف، مما يعكس الترتيب النسبي للأولويات ومعايرة الفروقات بين الأولويات.
على الرغم من أن معظم [النماذج](/tag/النماذج) أعادت إنتاج ترتيب القيم الإنسانية، إلا أن بعضها بالغ في الفروقات بينها، مما يظهر أن [النماذج](/tag/النماذج) قد تتوافق مع [المعايير](/tag/المعايير) التقليدية بينما لا تزال تختلف عن [معايرة](/tag/معايرة) [القيم البشرية](/tag/القيم-البشرية). كما أظهرت [دقة](/tag/دقة) الملف تباينًا كبيرًا بين النماذج، ولم تتماشى بشكل موحد مع الحجم أو حداثة النموذج أو مستوى القدرة.
هذه النتائج تثير تساؤلات هامة حول التطورات المستقبلية للأنظمة الذكية ذات [الوكالة](/tag/الوكالة) المتزايدة. من خلال هذه الدراسة، تأتي الموضوعات الستة والمقياس القائم على الملف كطريقة قابلة للتطبيق لفحص ملفات قيم [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) قبل نشرها في [سياقات](/tag/سياقات) حيث توافقها مع أولويات البشر أمر بالغ الأهمية.
استكشاف توافق الذكاء الاصطناعي في نماذج اللغات الضخمة: تحليل قيم 75 نموذجًا مع تقييمات بشرية
في دراسة جديدة، تم فحص توافق الذكاء الاصطناعي في نماذج اللغات الضخمة من خلال تحليل 75 نموذجًا. نتائج الدراسة تظهر تحديات بتحديد أولويات القيم بين الأنظمة البشرية والذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
