في عالم تكنولوجيا النقل، يعد الكشف الدقيق عن الأجسام ثلاثية الأبعاد أمرًا محوريًا لضمان سلامة المركبات المستقلة. ومع تطور أنظمة الاتصال بين المركبات (Vehicle-to-Everything) المعروفة اختصارًا بـV2X، تبرز أهمية الرؤية التعاونية التي تعتمد على تبادل البيانات الإدراكية بين المركبات لتحسين دقة الكشف عن الأجسام. ورغم أن هذه التكنولوجيا تقدم مزايا رائعة، إلا أنها تواجه تحديات كبيرة بسبب تأثيرات القنوات المتدهورة مثل الضوضاء، التلاشي، والتداخل.

استجابة لهذه التحديات، يقدم الباحثون نموذج AFFormer (Adaptive Feature Fusion Transformer)، وهو إطار عمل مبتكر قائم على تقنية Transformers مصمم لتعزيز موثوقية الرؤية التعاونية في ظل ظروف الاتصال التي تعكس تأثيرات القنوات المشتركة. يعتمد AFFormer على ثلاث وحدات رئيسية تعمل جنبًا إلى جنب لتقليل التأثيرات السلبية للميزات المفسدة:

1. **التجميع الزمني ومتعدد الوكالات**: يتيح دمج السياقات بشكل واعٍ عبر الوكالات والزمن.
2. **الاهتمام المكاني المزدوج**: يعزز النموذج من كفاءة نمذجة الاعتمادية المكانية.
3. **الدمج المعتمد على عدم اليقين**: يقوم بتحسين الميزات المدمجة بناءً على استراتيجيات تقليل عدم اليقين.

علاوة على ذلك، يتم تطبيق استراتيجية تمييز المعرفة بين المعلم والطالب لتعزيز قوة النموذج من خلال مواءمة الميزات المدمجة مع إشراف موثوق في بداية التعاون. لقد تم اختبار AFFormer على مجموعتي البيانات V2XSet وDAIR-V2X، حيث أظهر تفوقًا ملحوظًا على الأساليب السابقة في الظروف المثالية والمُعطلة، مما يثبت قدرته على تحسين قوة النموذج تجاه تدهور الميزات الناتجة عن الاتصال مع الحفاظ على توازن فعالية وكفاءة الأداء.

إن AFFormer يمثل خطوة نحو مستقبل أكثر أمانًا في عالم النقل الذكي، مما يعكس القدرة على الاستفادة من الذكاء الاصطناعي في تحسين الممارسات الحالية.