في خطوة جديدة لتحليل حدود نماذج الأسس الجدولية (Tabular Foundation Models)، يتم الكشف عن كيف أن هذه الأنظمة لا تستطيع معالجة البيانات التي تم إنتاجها بواسطة أنظمة تشغلها بدون الوصول إلى القوانين التي تحكمها. عندما نعرض المنطق على طاولة النقاش، يمكننا القول إن هذا النقص يعتبر عائقًا كبيرًا في تطبيق هذه النماذج.
تطرح الدراسة ما يعرف باختبار تيرينغ التشغيلي (Operational Turing Test - OTT)، الذي يُبني على إنشاء أزواج من حالات قاعدة بيانات قانونية وأخرى تنتهك القواعد، بحيث تتطابق توزيعات القيم بحد أدنى إجمالي محدود جداً (أقل من 0.02). باستخدام نظرية ليم للي كام (Le Cam’s lemma)، يحدد الباحثون أن أي مصنف يعتمد فقط على القيم سيواجه خطأ يمكنه أن يصل إلى ما لا يقل عن 0.49 في اختبار بايز.
شارك فريق البحث في اختبار ثلاثة نماذج (XGBoost، TabICL، TabPFN) وقد وجدت جميعها أن لديها دقة تصل إلى 0.50، مما يدل على أن الوصول إلى الصفوف الخام لا يحسن النتائج بشكل فعال. ومع ذلك، عند تقديم مراجعات قائمة على القوانين القابلة للتنفيذ، تمكن أحد النماذج من الوصول إلى دقة تصنيف بنسبة 100%.
خلال ثلاث تجارب نمذجة مع نماذج لغوية ضخمة (Large Language Models - LLM) بمطابقة 100 حالة، أظهرت النتائج أن النماذج التي مُنحت الوصول إلى جداول القوانين وملفات الحالة لم تستطع تصنيف أكثر من 2 من أصل 50 حالة قانونية على أنها قانونية. حتى نموذج GPT-5.5 لم يتمكن من تحديد أي حالة قانونية بمعدل تصنيف صفر.
يعيد هذا البحث توجيه النقاش حول كون العائق الحقيقي في نماذج الأسس الجدولية هو قابلية التعرف، وليس القدرة على المعالجة. حتى مع توافر البيانات الغزيرة والميزات الغنية، لن تتمكن هذه الأنظمة من تجاوز هذا العائق المتمثل في عدم وجود قاعدة عمليات واضحة.
بنهاية المطاف، ينبغي أن نتساءل: ما أهمية وجود القوانين والعوامل التشغيلية في تطوير وتطبيق نماذج الذكاء الاصطناعي؟ شاركونا آراءكم في التعليقات!
حاجز رسمي جديد: نماذج الأسس الجدولية لا تستطيع معالجة البيانات دون قوانينها
تكشف دراسة جديدة عن العجز الحاد لنماذج الأسس الجدولية في التعامل مع البيانات المؤسسية دون الوصول إلى القوانين المنظمة. يُظهر الاختبار الجديد مدى أهمية القوانين في عملية التصنيف الفعال.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
