ظهرت استراتيجية حساب الزمن الاختباري (Test-time Compute) كوسيلة واعدة لتحسين قدرات التفكير لدى نماذج اللغات الضخمة (Large Language Models - LLMs). ولكن هذه الاستراتيجية أدت إلى زيادة مدفوعات المستخدمين لمزودي الخدمات السحابية، حيث يتم فرض رسوم على كل وحدة زمنية يستخدمها العملاء لإنتاج النتائج.

تشير الدراسات إلى أن سوق خدمات نماذج اللغات الضخمة يشوبه عدم الكفاءة الاجتماعية. فبالرغم من توظيف مزودي الخدمة المزيد من حساب الزمن الاختباري، فمن الممكن أن تكون الإضافات غير فعالة في تحسين جودة المخرجات. لمواجهة هذه المشكلة، تم اقتراح آلية مزاد عكسي من نوع السعر الثاني، حيث يتقدم المزودون بعروض الأسعار والجودة المتوقعة للحصول على فرصة تقديم الخدمة للمستخدمين. يدفع المستخدمون بنسب تتناسب مع القيمة الهامشية التي ينتجها المزود الفائز مقارنة بالعطاء الثاني الأعلى.

ومن أجل دعم نتائجنا النظرية، أجرينا تجارب على مجموعة متنوعة من نماذج الإرشاد مثل عائلات لاما (Llama) وكوين (Qwen)، بالإضافة إلى نماذج التفكير المستخلصة من DeepSeek-R1، على بيانات مرجعية في الرياضيات والعلوم.

يسلط هذا البحث الضوء على أهمية تطوير استراتيجيات ذكية ومجدية في الأسواق السحابية لتحسين تجربة المستخدمين وزيادة كفاءة الخدمات.

ما رأيكم في هذه الاستراتيجيات؟ هل تعتقدون أنها يمكن أن تغير من طريقة تعاملنا مع الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!