تعتبر أنظمة البحث المعتمد على المعالجات المجمدة في الرؤية الحاسوبية (Vision Encoders) من الأدوات الأساسية التي تعزز فاعلية الذكاء الاصطناعي. ومع ذلك، تواجه هذه الأنظمة تحدياً عند الاستجابة لاستفسارات من فئات غير مرئية. حيث تظهر المشكلة عندما تفشل النماذج الحالية في التعامل مع هذا التحول، مما يؤدي إلى انخفاض كبير في دقة النتائج.

يعتمد علاج هذه القضية على تقنية جديدة تُعرف بـ "التوافق الجيوديسي الإقليدي" (Euclidean Geodesic Alignment - EGA) والتي تمثل طفرة في مجال التدريب على المحولات. تعتمد EGA على ثلاثة مبادئ رئيسية: التهيئة الصفرية، وخسارة الثلاثيات المحلية، وإسقاط الهيبر كروية. هذه المجموعة من المبادئ تعمل معًا على خلق ديناميكية ذاتية التحديد، حيث تتوقف الثلاثيات التي تحقق هامشًا صغيرًا عن إنتاج التدرجات، مما يؤدي إلى توقف المُعدّل عن التحديث عند النقاط الصحيحة هندسياً.

تظهر التجارب أن 96.5% من الثلاثيات تصل إلى حالة عدم التدرخ بينما تبقى مناطق الفئات غير المرئية بحالة جيدة، مع القدرة على تحسين كامل لأي فئات مرئية. وعلى مدى خمسة اختبارات متنوعة، حققت EGA أعلى دقة في النتائج المئوية على أربعة تقسيمات رئيسية وحققت تحسينًا ثابتًا على الخامس. لفت انتباه الباحثين أيضا قوة تصميمها وقدرتها على التوافق مع أنواع أقوى من الهياكل الأساسية بالإضافة إلى CLIP، مما يعكس قدرة EGA على المرونة وسهولة التكيف مع التقنيات الحديثة.

مع هذه الابتكارات، تسهل EGA على أنظمة البحث في الذكاء الاصطناعي التعامل مع بيانات غير معروفة، مما يمهد الطريق لمستقبل أكثر دقة وكفاءة في الأنظمة الذكية.

ما رأيكم في هذه التقنية الجريئة؟ شاركونا آرائكم في التعليقات.