في عالم [تطوير](/tag/تطوير) [واجهات](/tag/واجهات) الاستخدام المستندة إلى الذكاء الاصطناعي، تتزايد الحاجة إلى [أدوات](/tag/أدوات) [تقنية](/tag/تقنية) تساهم في [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) والكفاءة. هذا هو محور الورقة البحثية الجديدة التي تحمل عنوان AquaUI، والتي تتناول مسألة [المعلومات](/tag/المعلومات) غير المتناظرة في لقطات الشاشة.

تتسم [النماذج](/tag/النماذج) [متعددة الوسائط](/tag/متعددة-الوسائط) الكبيرة (Large [Multimodal Models](/tag/multimodal-models)) بدورها البارز في [دعم](/tag/دعم) [نماذج](/tag/نماذج) عملاء الواجهات الرسومية، إذ يتم إدخال لقطات الشاشة عالية [الدقة](/tag/الدقة) في مركز الطلبات خلال كل خطوة. ومع ذلك، تظهر هذه اللقطات عدم تجانس كبير في [كثافة المعلومات](/tag/كثافة-[المعلومات](/tag/المعلومات)): حيث يمكن أن تحتوي مناطق كبيرة على [معلومات](/tag/معلومات) قليلة وتبدو متشابهة بصريًا، في حين تتطلب النصوص والأيقونات الأساسية [دقة](/tag/دقة) بصرية عالية.

الحل يأتي مع AquaUI، الذي يمثل طريقة لتقليل الرموز في وقت [الاستدلال](/tag/الاستدلال) دون الحاجة إلى مزيد من [التدريب](/tag/التدريب). يعتمد [AquaUI](/tag/aquaui) على [بناء](/tag/بناء) شجرة رباعية (quadtree) قابلة للتكيف لكل لقطة شاشة، حيث يحتفظ برمز تم دمجه بشكل تمثيلي لكل ورقة في الشجرة الرباعية.

ما يميز [AquaUI](/tag/aquaui) هو الحفاظ على مواقع الرموز المحتفظ بها [عبر](/tag/عبر) جميع المراحل، مما يضمن تماسكًا في [ترميز](/tag/ترميز) المواقع. لتعزيز التماسك الزمني خلال [تفاعلات](/tag/تفاعلات) الواجهات المتعددة الخطوات، تم [اقتراح](/tag/اقتراح) [خوارزمية](/tag/خوارزمية) شجرة رباعية شرطية، تستفيد من استمرارية اللقطات المتعاقبة.

من خلال [تجارب](/tag/تجارب) على [نماذج](/tag/نماذج) العملاء للواجهات الرسومية المتطورة، أظهرت [AquaUI](/tag/aquaui) [تحسينات](/tag/تحسينات) ملحوظة في توازن [الدقة](/tag/الدقة) والكفاءة. على وجه الخصوص، سجلت زيادة قدرها 13.22% في [السرعة](/tag/السرعة) و29.52% في تقليل الرموز البصرية، مع الحفاظ على 99.06% من [أداء](/tag/أداء) الرموز الكاملة. تشير هذه النتائج إلى إمكانية الاستغلال الذكي للمعلومات غير المتناظرة بشكل فعال دون الحاجة لإعادة التدريب، مما يمثل خطوة كبيرة [نحو](/tag/نحو) [مستقبل](/tag/مستقبل) أكثر [كفاءة](/tag/كفاءة) في [تصميم](/tag/تصميم) الواجهات الرسومية.