في السنوات الأخيرة، حققت نماذج التدفق (Flow Models) تقدمًا ملحوظًا في مجالات متعددة، وخاصة في توليد النصوص. لكن عند تطبيق هذه النماذج بشكل بسيط على مهام التفكير المعقد مثل الألغاز مثل سودوكو وزيبرا، لوحظ أنها تُخرج إجابات خاطئة في كثير من الأحيان، حيث لم يتجاوز معدل النجاح 36% في حل ألغاز السودوكو.

لذا، تم تقديم نموذج Flow Reasoning Models (FRMs) كنموذج جديد يهدف إلى تحسين الأداء من خلال إنشاء إطار عمل للتدريب والاختبار. المباديء الأساسية لهذا النموذج تعتمد على فكرة أن نماذج التدفق يمكن أن تؤكد صحة إجاباتها بنفسها؛ فالحل الصحيح هو نقطة ثابتة مستقرة تعود إليها الإجابة عند إعادة صيغتها.

هذا يسمح للنموذج المقترح بتقديم العديد من الحلول المحتملة والاحتفاظ بتلك الحلول التي تتسم بالثبات الديناميكي، مما يرفع بشكل كبير معدل النجاح في حل ألغاز السودوكو (حوالي 100%) وزيبرا (95.9%). بل إن هذا النموذج يتجاوز أيضاً الألغاز الأكثر تعقيداً مثل Sudoku-Extreme، محققاً نجاحاً نسبته 96.1% دون الحاجة إلى تدريب مسبق على تلك الأنماط المعقدة.

ومع ذلك، يعتمد هذا النمط من البحث على الكثير من الوقت الحاسوبي من خلال إنتاج حلول خاطئة. لذلك، تم تصميم وصفة تدريب تهدف إلى تحسين كفاءة النموذج القاعدي. أولاً، يتم تدريب نماذج التدفق باستخدام قناة ذاتية التكييف تُغلق أثناء الاستدلال، مما يسمح لها بتحسين توقعاتها الماضية. ثانيًا، يتم تدريب النماذج لتفادي الإنتاجات الفاشلة مباشرة باستخدام تحسين التفضيل المباشر. هذه التحسينات أسفرت عن زيادة ملحوظة في كفاءة النموذج، مما أدى إلى تحقيق نتائج مبهرة تصل إلى 99.2% في ساودوكو بعد 7 محاولات فقط، وهي أقل بأكثر من 8 مرات من النموذج المتطابق الأقوى المستخدم للمقارنة.

مع دمج كل هذه الأساليب والابتكارات، يمكن لنماذج التدفق أن تحل الألغاز المعقدة خارج نطاق التوزيع بشكل أكثر كفاءة، مما يفتح آفاقاً جديدة لعالم الذكاء الاصطناعي وتطبيقاته في التفكير المعقد.