في مجال الذكاء الاصطناعي، تبرز دراسة جديدة تلقي الضوء على كيفية توجيه البشر لأعينهم عند مشاهدة مشهد ما، دون وجود مهمة معينة. يتضح أن البشر يبدؤون بنقل نظرهم نحو مركز المشهد ثم يثبّتون أنظارهم على الأشخاص والنصوص والأشياء المتفاعلة، مما يفتح أمامنا باباً لفهم أعمق لهذه الظاهرة.
تظهر الأبحاث الحديثة أن نموذج ذكاء اصطناعي تم تدريبه ليحاكي عملية الفهم البصري، وهو نموذج يعتمد على تقنية الفوفيات (foveation)، يمكنه إنتاج أنماط تثبيت تشبه تلك التي تُظهرها عيون البشر. وهذا يدل على أن الطريقة التي نركّز بها أنظارنا ليست مجرد سلوك عفوي، وإنما قد تكون نتيجة لعملية معقدة تهدف إلى تحسين فهمنا للمشهد البصري المحيط بنا.
ما يثير اهتمامًا أكبر هو أن النسخ الأخرى من هذا النموذج، التي تم تدريبها لأغراض بحث أو تصنيف أو تلك التي تمتلك رؤية محيطية أفضل أو أسوأ من الرؤية البشرية، لم تُظهر دقة في توقع أنماط التثبيت البشري كما فعل النموذج المخصص لفهم المشهد. وبالتالي، يمكن أن نستنتج أن أنماط الفحص البشري قد تكون ناتجة عن تحسينات وظيفية مرتبطة بالتكيف مع قيود رؤية الفوفيات.
هذا الاكتشاف يفتح المجال لمزيد من الأبحاث حول العلاقة بين الرؤية البشرية والذكاء الاصطناعي، ويسلط الضوء على كيفية استفادتنا من فهم العمليات البصرية في تصميم تطبيقات ذكية وفعالة تستند إلى نموذج الإدراك البشري.
لماذا ننظر إلى ما ننظر إليه؟ اكتشاف أسرار نموذج اللغة البصرية القائم على الانتباه الفوفياتي!
توصل الباحثون إلى استنتاجات مثيرة حول كيف ينظر البشر إلى المشاهد، حيث يظهر نموذج ذكاء صناعي أنماط تثبيت مشابهة لتلك التي يقوم بها البشر. يبدو أن هذه الأنماط هي نتيجة لتحسين فهم المشهد تحت قيود رؤية الفوفيات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
