في عالم تتزايد فيه الحاجة إلى التعرف على النصوص في المشاهد بشكل سريع وفعال، يواجه الباحثون تحديات عديدة، منها ارتفاع تكلفة النماذج الثقيلة التي تحتاج إلى تدريب مكثف. ولكن بفضل التطورات الحديثة، تم تقديم إطار عمل جديد ومبتكر لا يتطلب عملية التدريب التقليدية. هذا النظام ليس مصمماً فقط ليكون خفيف الوزن، بل يعمل أيضاً بوضع التركيبات السياقية في الاعتبار، مما يضمن تحسين التوقعات بشكل دقيق.

يستند الإطار الجديد على استخدام فهم السياق، حيث يتم استبدال الطريقة التقليدية للكشف عن النصوص بالاعتماد على مرحلة تقسيم تعتمد على الانتباه، تقوم بتصفية مناطق النصوص المقترحة بشكل دقيق عند مستوى البكسل. بدلاً من إجراء مقارنة تقليدية تعتمد على كتلة من البيانات بين خريطة الميزات والصورة الأصلية، يتم استخدام المعلومات السياقية لتوليد توقعات مباشرة للكلمات.

تعتمد التوقعات النهائية على تقييم دلالي ولفظي، مما يسمح بإمكان معالجة أسرع من خلال تجاوز المراحل الثقيلة للكشف عن النصوص. نتائج التجارب على معايير عامة تظهر أن هذا النظام يحقق أداءً يضاهي الأنظمة الأكثر تقدماً، ولكنه يحتاج إلى موارد أقل بكثير.

يمكنك الاطلاع على الكود الخاص بالنظام هنا: [https://ritabrata04.github.io/Context-driven-STR/]. هل تعتقد أن هذه التكنولوجيا ستغير مستقبل التعرف على النصوص؟ شاركونا آراءكم في التعليقات!