في عصر يُعتبر فيه الذكاء الاصطناعي (AI) مفتاحًا للابتكار، يظهر نموذجٌ هجين لرؤية اللغة (Vision-Language) كمحطة مفصلية في مجال الفحص الصناعي. حيث تواجه الصناعة تحديات في الفحص وتقارير العيوب، يقدم هذا النموذج المتطور حلاً متكاملاً يؤمن كلا الجانبين بدقة عالية.

تتكون هذه المعمارية الهجينة من ثلاثة مكونات رئيسية:

1. **Eyes**: وهو كاشف عيوب يعتمد على نموذج YOLO26-x-obb الذي يقوم بتحديد العيوب بدقة وفي الوقت الحقيقي، مما يمكن المشغلين من تلقي صور دقيقة وبيانات موثوقة في لحظة واحدة.

2. **Bridge**: يأتي كحل وسيط بين الكشف عن العيوب ومرحلة إنتاج التقارير. حيث يقوم بتحويل كل منطقة عيوب مُكتشفة إلى رموز مكانية متخصصة، مما يُسهل عملية استخراج المعلومات.

3. **Brain**: يعتمد على نموذج Qwen-2.5-1.5B، المُعدل بواسطة تقنية QLoRA، والذي يتيح توليد تقارير JSON منظمة بناءً على المدخلات المُعطاة. يُحسن هذا النموذج من جودة التقارير بفضل التدريب على مجموعة بيانات واسعة تضم 947 تقريرًا صيانة مُصنّع.

أثبتت التجارب أن هذه المعمارية المُفككة تخطت النماذج التقليدية من حيث جودة التقارير والفعالية، حيث حصلت على تقييمات أعلى في مقاييس مثل BLEU-4 وROUGE-L، مقابل نموذج رؤية-لغة متكامل لا يحقق نفس النتائج.

في المجمل، تُظهر النتائج كيف يمكن للهياكل الموجهة وتخصيص نماذج الذكاء الاصطناعي على مدى واسع أن تُحدث فارقًا كبيرًا في كفاءة العمل، بل وقد تغيّر طريقة التنفيذ في المستقبل القريب.