ثورة جديدة في الذكاء الاصطناعي: كيفية تجاوز النصوص إلى الصور في البحث الذكي

Q: ما هو موضوع مقال "ثورة جديدة في الذكاء الاصطناعي: كيفية تجاوز النصوص إلى الصور في البحث الذكي"؟

يتناول المقال بالتفصيل والتحليل آخر الأخبار والتطورات المتعلقة بـ "ثورة جديدة في الذكاء الاصطناعي: كيفية تجاوز النصوص إلى الصور في البحث الذكي" في عالم الذكاء الاصطناعي والتكنولوجيا الناشئة.

في عالم يتطور فيه الذكاء الاصطناعي بسرعة، تمثل تقنية PixelRAG (استرجاع مضخم بالصور) خطوة جديدة نحو مستقبل أكثر كفاءة في معالجة المعلومات من الويب. على الرغم من أن نماذج اللغات الضخمة (Large Language Models) قد أصبحت نموذجًا يُعتمد عليه بشكل متزايد، إلا أن الاعتماد على النصوص فقط لتمثيل المعلومات يعاني من قيود عدة.

تُقدم تقنية PixelRAG طريقة مبتكرة لتمثيل مواقع الويب في صورتها البصرية الأصلية، بحيث يتم إجراء عمليات البحث والقراءة بالكامل داخل فضاء واضح للصورة، مما يُلغي حاجة التحويل النصي المعقد. تم تصميم هذه التقنية لتكون الأكثر تقدمًا في القدرة على التعامل مع بيانات ضخمة، حيث تستطيع الوصول إلى قاعدة بيانات تضم 30 مليون صورة شاشة من موسوعة ويكيبيديا.

بنيت PixelRAG على نموذج تضمين بصري موجود (Qwen3-VL-Embedding)، وتم تحسينه من خلال بيانات تدريب معدة بعناية. تتم معالجة الصور المسترجعة مباشرة كمدخلات لنموذج فهم بصري، مما يُساعد في تخطي العمليات النصية التقليدية.

نتائج التجارب تشير إلى أن PixelRAG تتفوق باستمرار على النماذج التي تعتمد على النصوص، حيث حققت ارتفاعًا في الدقة يصل إلى 18.1%. هذا الإنجاز يفتح آفاقًا جديدة في مجالات متعددة، مثل البحث عن مواضيع معقدة أو التعامل مع بيانات غير منسقة.

من المثير للدهشة أن تمثيلات الصور تُظهر كفاءة أكبر من نصوص الويب، مما يعني أن المستقبل قد يكون في الاعتماد على التصورات البصرية بدلاً من الكلمات. ينتظرنا مستقبل مليء بالإمكانات الجديدة للذكاء الاصطناعي!

ثورة جديدة في الذكاء الاصطناعي: كيفية تجاوز النصوص إلى الصور في البحث الذكي

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

ثورة ذكاء اصطناعي: المساعد الجديد من أدوبي يمكنه إنجاز المهام عبر جميع تطبيقاتك الإبداعية!

ثورة جديدة في عالم الحوسبة: استثمار ضخم ينذر بإطلاق عملاق الحوسبة التالي

هل تتجه أنظار المستثمرين نحو Anthropic بعد موجة الدولار؟