تتطور [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) ([LLMs](/tag/llms)) لتصبح العمود الفقري لوكلاء الإنترنت المستقلين ونظم [المعلومات](/tag/المعلومات) المعقدة على الويب، مما يجعل قدرتها على [تحويل اللغة](/tag/[تحويل](/tag/تحويل)-[اللغة](/tag/اللغة)) الطبيعية إلى أشكال هيكلية دقيقة أمرًا بالغ الأهمية، خصوصًا عند استدعاء [واجهات](/tag/واجهات) [التطبيقات](/tag/التطبيقات) البرمجية ([APIs](/tag/apis)) وتبادل [البيانات](/tag/البيانات). ومع ذلك، يظل [تقييم](/tag/تقييم) [دقة](/tag/دقة) الهيكل لهذه [النماذج](/tag/النماذج) في [بيانات](/tag/بيانات) الويب أمرًا مُعقدًا؛ حيث تفشل [مقاييس](/tag/مقاييس) النصوص التقليدية في التقاط [التناسق](/tag/التناسق) الطوبولوجي في [البيانات](/tag/البيانات) شبه الهيكلية، بينما تتسم [التقييمات](/tag/التقييمات) اليدوية بالتكلفة العالية.

لذا، نُقدم [إطار العمل](/tag/إطار-العمل) الجديد المعروف باسم Structure-BiEval، الذي يعتمد على [التعلم الذاتي](/tag/[التعلم](/tag/التعلم)-الذاتي) لتقييم الجودة بشكل كمي، دون الحاجة إلى [بيانات](/tag/بيانات) مُعلّمة، مما يجعله مخصصًا لهندسة [بيانات](/tag/بيانات) الويب. من خلال الاستفادة من [تمثيلات](/tag/تمثيلات) وسطية حتمية، يُمكن لإطار العمل هذا فصل الهيكل عن المحتوى بدقة، مستخدمًا [مقاييس](/tag/مقاييس) [دقة](/tag/دقة) المحتوى الدلالي (Content Semantic Accuracy) والمسافة المحررة الطبيعية للأشجار (Normalized Tree Edit Distance).

لقد قمنا بإجراء [تقييم](/tag/تقييم) تجريبي على 15 نموذجًا من [نماذج [اللغة](/tag/اللغة) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)-الضخمة) المتقدمة [عبر](/tag/عبر) هيكليتين مختلفتين على الويب؛ وهما [بيانات هيكلية](/tag/[بيانات](/tag/بيانات)-هيكلية) هرمية (Hierarchical Data) وبيانات جدولية (Tabular Data). تُظهر النتائج تباينًا كبيرًا في [الأداء](/tag/الأداء) الهيكلي، مع حالات يُظهر فيها [نماذج](/tag/نماذج) متوسطة الحجم أداءً يفوق نظرائها الأكبر في [تنسيق بيانات](/tag/[تنسيق](/tag/تنسيق)-[بيانات](/tag/بيانات)) الويب. وعلاوة على ذلك، تكشف نتائجنا أن العش nesting العميق يمثل تحديًا متكررًا لوكلاء الويب [عبر](/tag/عبر) قياسات معلمات مختلفة.

يُعد هذا [البحث](/tag/البحث) خطوة مهمة [نحو](/tag/نحو) [تحسين](/tag/تحسين) طرق [تقييم](/tag/تقييم) [نماذج اللغة](/tag/[نماذج](/tag/نماذج)-[اللغة](/tag/اللغة)) الضخمة، مما يساهم في تعزيز [دقة](/tag/دقة) استجابة [نظم المعلومات](/tag/نظم-[المعلومات](/tag/المعلومات)) على الويب. هل أنتم متحمسون لرؤية كيف سيغير هذا [الابتكار](/tag/الابتكار) [مستقبل](/tag/مستقبل) [تقنيات الذكاء الاصطناعي](/tag/[تقنيات](/tag/تقنيات)-الذكاء-الاصطناعي)؟ شاركونا آرائكم في [التعليقات](/tag/التعليقات).