في ظل الزيادة الملحوظة في استخدام كاميرات [السيارات الذاتية](/tag/السيارات-الذاتية) (dashcam)، أصبح من الضروري [تطوير](/tag/تطوير) [أساليب](/tag/أساليب) فعالة لكشف الحوادث الحرجة مثل التصادمات. تعد هذه الأحداث نادرة وسريعة، مما يجعل من الصعب على [نماذج الرؤية](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)) العامة التعامل معها. في هذا الصدد، نقدم لكم [VLM](/tag/vlm)-AutoDrive، إطار عملي تم تطويره لتحسين [نماذج [الرؤية](/tag/الرؤية)-اللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-[اللغة](/tag/اللغة)) ([Vision-Language Models](/tag/vision-language-models)) المُدربة مسبقًا فيما يخص [كشف](/tag/كشف) هذه الأحداث الحاسمة في [القيادة الذاتية](/tag/[القيادة](/tag/القيادة)-الذاتية).

تستند [VLM](/tag/vlm)-AutoDrive إلى دمج عناوين وصفية مستخرجة من البيانات، ووصفيات مولدة بواسطة [نماذج [اللغة](/tag/اللغة) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الكبيرة) (Large Language [Models](/tag/models))، بالإضافة إلى أسئلة وأجوبة تعتمد على [الصور](/tag/الصور). باستخدام هذه الأساليب، يتمكن الإطار من [تحقيق](/tag/تحقيق) [تعلم](/tag/تعلم) متوافق ومفهوم في [سياقات](/tag/سياقات) [القيادة](/tag/القيادة).

أظهرت [نتائج التجارب](/tag/نتائج-[التجارب](/tag/التجارب)) أن [نماذج](/tag/نماذج) [VLM](/tag/vlm) التقليدية مثل [نموذج](/tag/نموذج) [NVIDIA](/tag/nvidia) Cosmos-Reason1 7B تعاني من ضعف شديد في قدرة [كشف](/tag/كشف) التصادمات، حيث سجلت استدعاءً قريبًا من الصفر عندما استخدمت في بيئات لا تعتمد على [تدريب مسبق](/tag/[تدريب](/tag/تدريب)-مسبق). ومع إدخال [VLM](/tag/vlm)-AutoDrive، تحسنت القيمة F1 للتصادم من 0.00 إلى 0.69، وارتفعت [دقة](/tag/دقة) الكشف الإجمالية من 35.35% إلى 77.27%.

تُظهر هذه التطورات المذهلة قدرة [VLM](/tag/vlm)-AutoDrive على [تكييف](/tag/تكييف) [نماذج [الرؤية](/tag/الرؤية)-اللغة](/tag/[نماذج](/tag/نماذج)-[الرؤية](/tag/الرؤية)-[اللغة](/tag/اللغة)) العامة لمهام الإدراك الحرجة المتعلقة بالزمن، مما يعزز [إجراءات](/tag/إجراءات) [الأمان](/tag/الأمان) في [القيادة الذاتية](/tag/[القيادة](/tag/القيادة)-الذاتية). وأكدت [التجارب](/tag/التجارب) المنفذة على مقاطع [الفيديو](/tag/الفيديو) الحقيقية من كاميرات Nexar أن النظام يحقق [تحسينات](/tag/تحسينات) ملحوظة في [كشف](/tag/كشف) التصادمات والقرب من التصادم، بينما ينتج مسارات تمييزية قابلة للتفسير تربط بين الإدراك والسبب والقرار في عالم [القيادة الذاتية](/tag/[القيادة](/tag/القيادة)-الذاتية).

ما هي آرائكم حول [تقنية](/tag/تقنية) [VLM](/tag/vlm)-AutoDrive؟ هل تعتقدون أنها ستغير قواعد [اللعبة](/tag/اللعبة) في مجالات [القيادة الذاتية](/tag/[القيادة](/tag/القيادة)-الذاتية)؟ شاركونا بالتعليقات!