في أحدث الدراسات المتعلقة بالذكاء الاصطناعي، تم الكشف عن نتائج مثيرة للدهشة بشأن تأثير الميزات المستخرجة من نماذج اللغات الضخمة (Large Language Models) على الشبكات العصبية الرسومية (Graph Neural Networks). في حين أنه يُعتقد عادةً أن دمج هذه الميزات يعزز دقة التعلم، تم التوصل إلى استنتاج مفاجئ: فإن إدخال الميزات عبر تجميعها مباشرة، دون اتباع أساليب مثل التدريب المشترك أو التحسين، قد يؤدي إلى تدهور تدريجي في الأداء.
أظهرت البيانات أن إدماج ميزات نماذج GPT-4o-mini TAPE عبر التقنيات التقليدية يقلل من دقة الاختبارات، على سبيل المثال، اختبار PubMed شهد انخفاضاً بمعدل 17%، بينما انخفض اختبار Cora بمقدار 4.3%. ما يثير الاهتمام هو أن هذا الانخفاض يتزايد في الحالات التي تخضع لمحددات معينة، بينما بدت النتائج متناقضة في حالات أخرى مثل WikiCS وogbn-arxiv التي سجلت ارتفاعات.
للتنبؤ بموعد تأثر الأداء بإدماج الميزات، تم تقديم مقياس بسيط يسمى Delta_sig، والذي أظهر ارتباطًا أقوى بتكاليف الدمج مقارنة بمستوى التشابه بين العُقد (homophily). يُظهر هذا الاكتشاف ضرورة النظر إلى كيفية وفائدة استخدام ميزات نماذج اللغات الضخمة في التطبيقات المختلفة لدراسة الشبكات العصبية.
في النهاية، يظهر أن هناك حاجة لتفكير أعمق واستراتيجيات مبتكرة عند دمج التقنيات الحديثة في نماذج الذكاء الاصطناعي، بدلًا من الاعتماد على الافتراضات السائدة.
هل يمكن أن تؤذي الميزات المستخرجة من نماذج اللغات الضخمة الشبكات العصبية الرسومية؟
تظهر الدراسات الجديدة أن إدخال ميزات مستخرجة بواسطة نماذج اللغات الضخمة يمكن أن يؤدي في بعض الأحيان إلى انخفاض دقة الشبكات العصبية الرسومية. هذا الاكتشاف يتحدى الاعتقاد السائد أن دمج هذه الميزات يحسن الأداء.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
