تشكل [نماذج](/tag/نماذج) [سلوك](/tag/سلوك) [القيادة](/tag/القيادة) البشرية أساسًا حيويًا لتقدير [السلامة](/tag/السلامة) في [السيارات الآلية](/tag/السيارات-الآلية) (AVs)، غير أن [النماذج](/tag/النماذج) الحالية تواجه معضلة بين وضوح النتائج ومرونة التطبيق. في هذا الإطار، تشكل [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) العامة (Large Language [Models](/tag/models)) مثل [OpenAI](/tag/openai) [o3](/tag/o3) وGoogle [Gemini](/tag/gemini) 2.5 Pro بديلاً مشوقًا، حيث يمكن [نشر](/tag/نشر) [نموذج](/tag/نموذج) واحد بشكل فعّال [عبر](/tag/عبر) سيناريوهات مختلفة دون الحاجة إلى [تعديل](/tag/تعديل) معاييره.

لقد قمنا بدراسة متعمقة في هذا المجال [عبر](/tag/عبر) دمج النموذجين كعوامل [قيادة](/tag/قيادة) مغلقة الدائرة في سيناريو بسيط للتداخل. باستخدام [تحليلات](/tag/تحليلات) كمية ونوعية، قمنا بمقارنة [سلوك](/tag/سلوك) هذه [النماذج](/tag/النماذج) مع [بيانات](/tag/بيانات) بشرية.

أظهرت النتائج أن كلا النموذجين يعكسان أنماط السيادة التشغيلية البشرية، لكنهما يفتقدان القدرة على التقاط الاستجابة البشرية لمؤشرات [السرعة](/tag/السرعة) الديناميكية بدقة. كما تباين [أداء](/tag/أداء) [السلامة](/tag/السلامة) بين النموذجين بشكل ملحوظ. كما أظهر [تحقيق](/tag/تحقيق) منهجي حول [تفضيلات](/tag/تفضيلات) الإدخال أن مكونات النموذج تعمل كتحيزات استنتاجية نموذجية لا تتنقل [عبر](/tag/عبر) [النماذج](/tag/النماذج).

تشير النتائج إلى إمكانية استخدام [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) العامة كنماذج [سلوك](/tag/سلوك) بشرية مستقلة في [تقييم](/tag/تقييم) السيارات الآلية، لكن ينبغي إجراء المزيد من [الأبحاث](/tag/الأبحاث) لفهم حالات الفشل وضمان فعاليتها كنموذج للسلوك البشري في [القيادة](/tag/القيادة).