في مجال الذكاء الاصطناعي، تبرز [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) تلقي الضوء على كيفية [توجيه](/tag/توجيه) البشر لأعينهم عند مشاهدة مشهد ما، دون وجود مهمة معينة. يتضح أن البشر يبدؤون بنقل نظرهم [نحو](/tag/نحو) مركز المشهد ثم يثبّتون أنظارهم على الأشخاص والنصوص والأشياء المتفاعلة، مما يفتح أمامنا باباً لفهم أعمق لهذه الظاهرة.
تظهر [الأبحاث الحديثة](/tag/[الأبحاث](/tag/الأبحاث)-الحديثة) أن [نموذج ذكاء اصطناعي](/tag/[نموذج](/tag/نموذج)-ذكاء-اصطناعي) تم تدريبه ليحاكي عملية الفهم البصري، وهو [نموذج](/tag/نموذج) يعتمد على [تقنية](/tag/تقنية) الفوفيات (foveation)، يمكنه إنتاج أنماط تثبيت تشبه تلك التي تُظهرها عيون البشر. وهذا يدل على أن الطريقة التي نركّز بها أنظارنا ليست مجرد [سلوك](/tag/سلوك) عفوي، وإنما قد تكون نتيجة لعملية معقدة تهدف إلى [تحسين](/tag/تحسين) فهمنا للمشهد البصري المحيط بنا.
ما يثير اهتمامًا أكبر هو أن النسخ الأخرى من هذا النموذج، التي تم تدريبها لأغراض [بحث](/tag/بحث) أو [تصنيف](/tag/تصنيف) أو تلك التي تمتلك [رؤية](/tag/رؤية) محيطية أفضل أو أسوأ من [الرؤية](/tag/الرؤية) البشرية، لم تُظهر [دقة](/tag/دقة) في توقع أنماط التثبيت البشري كما فعل النموذج المخصص لفهم المشهد. وبالتالي، يمكن أن نستنتج أن أنماط الفحص البشري قد تكون ناتجة عن [تحسينات](/tag/تحسينات) وظيفية مرتبطة بالتكيف مع [قيود](/tag/قيود) [رؤية](/tag/رؤية) الفوفيات.
هذا الاكتشاف يفتح المجال لمزيد من [الأبحاث](/tag/الأبحاث) حول العلاقة بين [الرؤية](/tag/الرؤية) البشرية والذكاء الاصطناعي، ويسلط الضوء على كيفية استفادتنا من [فهم](/tag/فهم) العمليات البصرية في [تصميم](/tag/تصميم) [تطبيقات ذكية](/tag/[تطبيقات](/tag/تطبيقات)-ذكية) وفعالة تستند إلى [نموذج](/tag/نموذج) الإدراك البشري.
لماذا ننظر إلى ما ننظر إليه؟ اكتشاف أسرار نموذج اللغة البصرية القائم على الانتباه الفوفياتي!
توصل الباحثون إلى استنتاجات مثيرة حول كيف ينظر البشر إلى المشاهد، حيث يظهر نموذج ذكاء صناعي أنماط تثبيت مشابهة لتلك التي يقوم بها البشر. يبدو أن هذه الأنماط هي نتيجة لتحسين فهم المشهد تحت قيود رؤية الفوفيات.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
