في عالم التصوير الطيفي العالي (Hyperspectral Imaging - HSI)، تتمكن الأجهزة من التقاط مئات النطاقات الطيفية الضيقة والمتجاورة، مما يجعلها أداة قوية في مجالات مثل علم الأحياء والزراعة والمراقبة البيئية. رغم ذلك، لا يزال تفاعل نماذج رؤية المحولات (Vision Transformers - ViTs) في هذا الإطار غير مستكشف بشكل كافٍ، وذلك بسبب تحديين رئيسيين:

1. تعاني الأساليب الحالية من صعوبة في التقاط إشارات طيفية ذات معنى، وغالبًا ما تنصب التركيز على رمز الفئة (class token) بدلًا من ذلك.
2. تعتبر نماذج ViTs الكاملة محملة بالحسابات المعقدة، مما يجعل قابلية تفسيرها تحدياً عاجلاً بالنظر للطبيعة عالية الأبعاد لبيانات HSI.

هنا يأتي دور فوكاس (FOCUS)، الإطار الذي يمثل ثورة في قابلية التفسير المكاني والطيفي لنماذج ViTs المجمدة. يتضمن FOCUS عنصرين رئيسيين:
- **تعليمات طيفية مخصصة للفئات**: توجيه الانتباه نحو مجموعات الطيف ذات المعاني الدالة.
- **رمز متعلم جديد (SINK token)**: يتم تدريبه باستخدام خسارة جذب لامتصاص الانتباه الضوضائي أو الزائد.

تعمل هذه التصميمات مجتمعة على إنتاج خرائط تمييز ثلاثية الأبعاد وقيم أقطاب طيفية يمكن فهمها بسهولة في خطوة واحدة، دون الحاجة إلى تراجع للوحدات أو تعديل الهيكل الأساسي. وقد أظهرت معايير الأداء أن FOCUS يعزز من مستوى تقارب القيم الطيفية (band-level IoU) بنسبة 15%، ويقلل من الانهيار الانتباهي بأكثر من 40%، مع نتائج تمييز تتماشى بشكل وثيق مع ملاحظات الخبراء.

مع زيادة نسبة التكاليف بمعدل أقل من 1%، يجعل هذا الأسلوب تفسير نماذج ViT عالية الدقة عملياً للتطبيقات الطيفية الحقيقية، مسجلاً خطوة كبيرة نحو ردم الفجوة بين نماذج الصندوق الأسود والقرارات الثقة في مجالات التصوير الطيفي.