في عالم الذكاء الاصطناعي، يعتبر دمج الأنماط المتعددة في نماذج اللغة الكبيرة (LLMs) طريقتنا المثلى لتعزيز فهم البيانات غير النصية. نماذج اللغة الرؤية (Vision Language Models) صارت واحدة من أسرع الفئات نموًا من النماذج متعددة الأنماط، بفضل استخدامها المتزايد في مجالات متعددة كالرعاية الصحية والروبوتات وسهولة الوصول.
ومع ذلك، لا تزال عملية تطوير هذه النماذج معقدة، إذ غالبًا ما يحددها خبراء بشريّون، مما يترك لنا حاجة ملحة لإطار عمل آلي يمكنه إنشاء نماذج متعددة الأنماط بناءً على المهام المخصصة.
هنا يأتي دور Mordal، الإطار الآلي الجديد الذي يسهل البحث عن أفضل نموذج لغة رؤية يناسب مهمة معينة بدون تدخل بشري. يعمل Mordal على تقليل عدد المرشحين المحتملين أثناء عملية البحث وكذلك تقليص الوقت المطلوب لتقييم كل نموذج متبقي.
وقد أظهرت النتائج أن Mordal يستطيع العثور على أفضل نموذج لتحدٍ معين باستخدام ما يقل عن 8.9 إلى 11.6 مرة من ساعات معالجة وحدات معالجة الرسوميات (GPU) مقارنة بأسلوب البحث التقليدي. كما أثبت Mordal تفوقه على الطرق التقليدية في اختيار النماذج، محققًا متوسط زيادة تقدر بنحو 69% في معدل Kendall's τ.
إن هذا التطور ليس مجرد خطوة للأمام في تصميم النماذج، بل تحول هائل نحو جعل الذكاء الاصطناعي أكثر كفاءة واستجابة لمتطلبات السوق المتزايدة.
Mordal: اختيار نماذج مسبقة التدريب وتحسين الذكاء الاصطناعي بسهولة وسرعة!
تقدم Mordal إطار عمل آلي لاختيار أفضل نماذج اللغة الرؤية (Vision Language Models)، مما يسهم في تعزيز أداء الذكاء الاصطناعي في المهام المتعددة. بفضل هذه التقنية الجديدة، يمكن تقليل الوقت والتكاليف اللازمة للوصول إلى النماذج الأمثل.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
