تحدث ثورة في ميدان الذكاء الاصطناعي مع اكتشاف جديد يتعلق بنماذج الرؤية واللغة، وخاصة نموذج CLIP. تعاني هذه النماذج في العادة عند تنفيذها على أجهزة محدودة الموارد، حيث يتطلب الأمر تقنيات مثل ضغط البيانات بتنسيق INT8. لكن هذه العملية قد تؤدي إلى مشكلة جديدة تُعرَف بانهيار تمثيل الكوانتيزات (Quantization-Induced Representation Collapse - QIRC).
يتسبب تراكم الضوضاء خلال طبقات التحولات (Transformer) في تغيير اتجاه التمثيل المتعدد الوسائط، مما يؤثر سلبًا على توافق الزوايا (Cosine Alignment) الضروري للاسترجاع بدون إشراف (Zero-shot Retrieval). في نموذج CLIP مع معمارية ViT-B/32، وجد الباحثون أن نسبة الضوضاء إلى الإشارة تنمو بشكل ملحوظ، مما يؤثر على دقة التصنيف.
للتغلب على ذلك، اقترح الباحثون تقنية جديدة تُعرف باسم LRA-EE (Layer-wise Representation-Aware Early Exit). تعمل هذه التقنية على تجاوز الطبقات العميقة المليئة بالضوضاء من خلال التجميع المكاني الدلالي، كما تقدم بوابة متعددة الميزات تعتمد على الثقة والهوامش العليا والتباين بين النشاطات الفضائية. نتيجةً لذلك، تم تحسين دقة التصنيف في مجموعة بيانات ImageNet-1K بنسبة ملحوظة بلغت 2.44%، بينما تم تقليل عدد العمليات الحسابية بنسبة 13.4% مقارنة بالخط الأساسي.
هذا الإنجاز الجديد قد يفتح آفاقًا جديدة في استغلال تكنولوجيا الذكاء الاصطناعي على الأجهزة ذات القدرات المحدودة، مما قد يغيّر مستقبل التفاعل بين الإنسان والآلة. كيف ترى دور هذه الابتكارات في تحسين أداء التطبيقات الذكية في حياتنا اليومية؟ شاركونا آراءكم في التعليقات!
ثورة الذكاء الاصطناعي: اكتشاف يغير قواعد اللعبة في نماذج الرؤية واللغة!
اكتشاف جديد يعالج مشكلة انهيار تمثيل الكوانتيزات في نماذج CLIP من خلال تقنية خروج مبكر ذكي، مما يحسن الأداء بشكل ملحوظ في التصنيف. هل تستطيع هذه التقنية الجديدة تغيير الطريقة التي نتفاعل بها مع الذكاء الاصطناعي؟
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
