في عالم الذكاء الاصطناعي، تبرز أهمية تطوير نماذج فعالة قادرة على توقع سلوك المستخدمين بدقة. أحدث دراسة حملت عنوان "Architecture-Sensitive Supervised Fine-Tuning for Screen-Conditioned Action Prediction" تنير الطريق نحو مزيد من التقدم في هذا المجال.
تتضمن الدراسة مقارنة ثلاث نماذج تم تدريبها تحت إشراف مع نماذج أخرى تعمل بنظام الصفر-ضبط على مجموعة بيانات وصفت بـ PiSAR (Persona, intent, Screen, Action, Rationale). هذه المجموعة تحتوي على 12,929 سجلًا سُجلت من مراجعات المتاجر العامة، وتستند على اتجاهات ديموغرافية من أبحاث Pew.
النتائج كانت مذهلة! حيث حققت نماذج مثل Claude Opus 4.7 وGPT-5.5 درجات sem_sim تراوحت بين 0.459 و0.482. بينما نموذج Qwen3-VL-8B-Instruct المُعدل تحت إشراف وصل إلى 0.783، متجاوزًا النماذج الأخرى بفارق كبير.
وعلى العكس، نموذج Gemma-4-26B-A4B-IT المُدرب بنفس البيانات والخطوات لم يتجاوز 0.441، مما يشير إلى أن طريقة التدريب ليست متناسقة مع نموذج التعلم العالي المعلمات.
إذاً، هل نشهد تحولاً في أساليب تطوير النماذج الذكية؟ وكيف يمكن لهذه النتائج أن تؤثر على المستقبل؟ نحن متحمسون لسماع آرائكم حول هذا التطور!
هل حان الوقت لتطوير توقعات الأفعال؟ اكتشافات مثيرة حول تكييف التعلم تحت إشراف جديد!
تقدّم دراسة جديدة مقارنة مثيرة للنماذج المدربة تحت إشراف مع نماذج الصفر-ضبط، مما يكشف عن تفوق ملحوظ لنموذج Qwen3-VL-8B-Instruct. هل ستغير هذه النتائج مستقبل توقعات الأفعال؟
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
