تشكل نماذج سلوك القيادة البشرية أساسًا حيويًا لتقدير السلامة في السيارات الآلية (AVs)، غير أن النماذج الحالية تواجه معضلة بين وضوح النتائج ومرونة التطبيق. في هذا الإطار، تشكل نماذج اللغة الكبيرة العامة (Large Language Models) مثل OpenAI o3 وGoogle Gemini 2.5 Pro بديلاً مشوقًا، حيث يمكن نشر نموذج واحد بشكل فعّال عبر سيناريوهات مختلفة دون الحاجة إلى تعديل معاييره.

لقد قمنا بدراسة متعمقة في هذا المجال عبر دمج النموذجين كعوامل قيادة مغلقة الدائرة في سيناريو بسيط للتداخل. باستخدام تحليلات كمية ونوعية، قمنا بمقارنة سلوك هذه النماذج مع بيانات بشرية.

أظهرت النتائج أن كلا النموذجين يعكسان أنماط السيادة التشغيلية البشرية، لكنهما يفتقدان القدرة على التقاط الاستجابة البشرية لمؤشرات السرعة الديناميكية بدقة. كما تباين أداء السلامة بين النموذجين بشكل ملحوظ. كما أظهر تحقيق منهجي حول تفضيلات الإدخال أن مكونات النموذج تعمل كتحيزات استنتاجية نموذجية لا تتنقل عبر النماذج.

تشير النتائج إلى إمكانية استخدام نماذج اللغة العامة كنماذج سلوك بشرية مستقلة في تقييم السيارات الآلية، لكن ينبغي إجراء المزيد من الأبحاث لفهم حالات الفشل وضمان فعاليتها كنموذج للسلوك البشري في القيادة.