تعتبر عمليات تقدير كثافة الازدحام (Occupancy Estimation) وعدّ الحشود (Crowd Counting) من المهام الحرجة في تصميم وسائل النقل العامة الذكية والفعالة. وعندما يتنوع تحميل وسائل النقل العامة من القليل إلى المزدحم، فإن النماذج التقليدية لتقدير الازدحام تحتاج إلى التكيّف لتلبية هذه التحديات. وقد أثبتت آليات الانتباه (Attention Mechanisms) قدرة مذهلة في تعزيز القوة التمثيلية لشبكات الأعصاب العميقة في عدّ الحشود في مشاهد مزدحمة تتسم بإعاقة، وخلفيات معقدة، وتشوهات في المنظور.

ومع ذلك، فإن المناهج التقليدية، التي غالبًا ما تُنفذ كشبكات فرعية مع معلمات ضمن الطبقات التلافيفية، تؤدي بلا شك إلى زيادة حجم النموذج وتكلفة الحسابات، مما يحد من إمكانية نشرها على الأجهزة الطرفية ذات الموارد المحدودة.

يستكشف هذا البحث فاعلية الآليات الحديثة للاهتمام بلا معلمات في عدّ الحشود وتقدير خريطة الكثافة في المشاهد ذات الازدحام العالي. نقوم بتقييم وحدات الانتباه بالتوازي (PFCA) والفضاء (SA) وثلاثية الأبعاد (SimAM)، ونقارن أدائها مع وحدات الانتباه المعلمة التي لا تتجاوز 1% من المعلمات الإضافية. إلى جانب ذلك، نقدم تركيبة جديدة من آليات الانتباه تجمع بين مزايا PFCA وSA (PFCASA) مخصصة لتحليل تدفقات الفيديو على متن أنظمة النقل العامة.

باستخدام CSRNet كهيكل أساسي، أظهرت التجارب على مجموعة بيانات ShanghaiTech أن آليات الانتباه بلا معلمات تحقق دقة تقارب أو تتفوق على النماذج التقليدية دون إدخال معلمات إضافية. كشفت تحليلات الأداء التفصيلية أن PFCASA يتفوق على وحدات الانتباه الأخرى في المشاهد التي تحتوي على أقل من 40 فردًا، بينما تُظهر PFCA فاعلية أكبر مع زيادة كثافة الحشود، مما يبرز إمكانياتها للتطبيق في أنظمة النقل العامة الذكية.