ثورة جديدة في عالم الذكاء الاصطناعي: Google DeepMind تطلق Vision Banana لتوليد الصور!
🔬 أبحاث1 دقائق للقراءة👁 0 مشاهدة

ثورة جديدة في عالم الذكاء الاصطناعي: Google DeepMind تطلق Vision Banana لتوليد الصور!

أعلنت جوجل ديب مايند عن إطلاق Vision Banana، مولد الصور المعتمد على التعليمات، والذي يتفوق على SAM 3 في تقسيم الصور وDepth Anything V3 في تقدير العمق المMetric. إن هذا الإنجاز يعيد تعريف حدود الرؤية الحاسوبية.

في خطوةٍ جديدة تعزز من مكانة جوجل كروّاد في عالم الذكاء الاصطناعي، أصدرت شركة Google DeepMind دراسة جديدة تقدم فيها نموذجًا مبتكرًا يُدعى Vision Banana، وهو مولد صور يستند إلى التعليمات (Instruction-Tuned Image Generator).

تُظهر النتائج التي عرضتها جوجل أن Vision Banana يتفوق بشكل ملحوظ على النموذج الحالي SAM 3 في مهمة تقسيم الصور، كما يحقق أداءً مذهلاً في تقدير العمق مقارنةً بالنموذج Depth Anything V3.

تعد هذه التطورات شهادة على أهمية التعليمات الموجهة في تحسين أداء أنظمة الرؤية الحاسوبية، بحيث تشبه في ذلك نموذج اللغة GPT الذي غيّر الكثير في مجال معالجة اللغة الطبيعية (Natural Language Processing). حيث تتسابق الشركات الآن لتطبيق هذه التكنولوجيا القادرة على تغيير قواعد اللعبة في عالم الذكاء الاصطناعي.

إذا كنت من عشاق التكنولوجيا وتهتم بمستقبل الذكاء الاصطناعي، فإن Vision Banana ليس مجرد مشروع بحثي، بل هو خطوة نحو مستقبل يتيح إنشاء صور عالية الجودة بناءً على التعليمات. كيف ستؤثر هذه التكنولوجيا على حياتنا اليومية؟

تابعوا أحدث التطورات في هذا المجال، وكنوا في طليعة المبتكرين! ما رأيكم في هذا التطور؟ شاركونا في التعليقات.
المصدر:مارك تيك بوستاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة