في عالم الذكاء الاصطناعي، أصبحت نماذج التفكير (Reasoning Models) جزءًا أساسيًا من تطبيقات مختلفة، من معالجة اللغة إلى الذكاء الصناعي. ولعل السؤال الذي يطرح نفسه هنا هو: هل تعكس الأسعار المدرجة لهذه النماذج تكاليفها الحقيقية؟
دراسة جديدة تناولت هذا الموضوع تعتبر الأولى من نوعها، حيث قامت بتقييم ثمانية نماذج رائدة عبر 12 مهمة متنوعة تشمل مسائل رياضية، الأسئلة العلمية، توليد الشيفرات، وعوامل متعددة المجالات.
المفاجأة كانت في اكتشاف ظاهرة تُعرف باسم "انقلاب الأسعار"، حيث تظهر النتائج أن 32% من المقارنات بين أزواج النماذج تتبين أن النموذج الذي يظهر سعره أقل ينتهي به الأمر إلى تكلف أكثر مقارنة بنظيره الأغلى. في بعض الحالات، بلغت الفجوة في التكاليف ما يصل إلى 28 ضعفًا! على سبيل المثال، يظهر أن سعر نموذج "جميني 3 فلاش" أقل بنسبة 80% من سعر "جي بي تي-5.4"، لكن التكلفة الفعلية لاستخدامه عبر جميع المهام كانت أعلى بنسبة 38%.
تم إنشاء إطار عمل رسمي لتوزيع التكاليف بناءً على قيمة شابل (Shapley value)، وذلك لتتبع العوامل المهيمنة التي تسهم في التباين الكبير في استهلاك الرموز التفكير وعدد التفاعلات. حيث يظهر أنه على نفس الاستفسار، قد يستخدم نموذج واحد 900% أكثر من الرموز العقلية مقارنة بنموذج آخر، أو يتطلب 10 أضعاف من تفاعلات البيئة.
الإشكالية هنا تكمن في صعوبة توقع تكاليف استخدام كل استعلام، حيث تظهر النماذج اختلافات تصل إلى 9.7 ضعف في استهلاك الرموز العقلية عبر تكرار نفس الاستعلام.
بناءً على هذه النتائج، تم التأكيد على أن الأسعار المدرجة بالكامل لنماذج الذكاء الاصطناعي ليست معبرة عن التكاليف الحقيقية، ما يستدعي اختيارًا واعيًا للنماذج المالية وضرورة المراقبة الشفافة للتكاليف لكل طلب.
ظاهرة انقلاب الأسعار: عندما تصبح نماذج التفكير الرخيصة أغلى!
تكشف دراسة جديدة أن الأسعار المدرجة لنماذج التفكير (RMs) لا تعكس دائمًا تكاليف الاستدلال الحقيقية، حيث قد تتجاوز تكلفة النماذج الأرخص نظراءها الأغلى. توضح النتائج أهمية الاختيار الواعي للعوامل المالية عند استخدام هذه النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
