في عالم المال المتغير بسرعة، تزايدت محاولات تقييم أداء وكالات الذكاء الاصطناعي التي تعتمد على نماذج اللغات الضخمة (LLMs) في أسواق الأسهم. عادةً ما يتم ذلك من خلال اختبار قدرتها على تحقيق أرباح في ظروف سوق تاريخية. ومع ذلك، قد تواجه هذه الطريقة عددًا من التحديات.
تتمثل إحدى القضايا الرئيسية في أن فترات الاختبار الطويلة تتداخل غالبًا مع حدود المعرفة للنماذج الرائدة، مما يؤدي إلى الاعتماد على معلومات متكررة مثل رموز الأسهم وأسعار السوق بدلاً من التفكير الاستثماري الفعلي.
لحل هذه الإشكالية، تم تقديم نموذج KTD-Fin (Knowing-To-Doing Financial Benchmark)، والذي يهدف إلى إجراء تقييم شامل لوكالات التداول. يعتمد هذا النموذج على بروتوكول تصفية البيانات الذي يقوم بإخفاء المعلومات الحساسة والتواريخ، مما يفصل بين الذاكرة التاريخية للسوق واتخاذ قرارات الاستثمار.
بالإضافة إلى ذلك، يستند النموذج إلى إطار عمل تقوم عليه تحليل الأداء، والذي يتيح تفكيك عوائد المحفظة إلى مكونات تتعلق بالسوق، والأسلوب، واختيار الأسهم. من خلال تقييم عشرة وكلاء LLM على مؤشر CSI300 في الصين خلال الفترة من 2024 إلى 2026، أظهرت النتائج أن التصنيف الدقيق للعوائد يظهر كيف أن استراتيجيات هذه الوكالات تعتمد في الغالب على التعرض السلبي للسوق وعوامل أخرى، مع وجود دليل محدود على وجود مهارات استثمارية قابلة للاستخدام.
إن هذه الاكتشافات تبرز أهمية استخدام مؤشرات جديدة مثل KTD-Fin، التي لا تقيم فقط ما إذا كان الوكيل يحقق أرباحًا، بل تختبر أيضًا ما إذا كانت مصادر العوائد تعكس مهارات استثمار فعلية وقابلة للنقل. لذا، تُعد هذه المعايير خطوة إلى الأمام نحو تقييم أكثر دقة لوكالات تداول الذكاء الاصطناعي.
من المعرفة إلى التنفيذ: معايير مبتكرة لتقييم وكالات تداول الذكاء الاصطناعي في أسواق الأسهم
تكشف دراسة جديدة عن نموذج KTD-Fin الذي يهدف إلى تقييم وكالات تداول الذكاء الاصطناعي بشكل شامل. يركز النموذج على تحسين قرارات الاستثمار من خلال معالجة عيوب التقييم التقليدي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
