تعتبر القدرة على فهم الوثائق الطويلة مسألة حيوية في العديد من المجالات، بما في ذلك الأعمال والقانون والبحث العلمي. ورغم ذلك، لم تستفد أفضل الأنظمة المتاحة من استراتيجيات التفكير التي قد تكون لها آثار كبيرة على أداء النماذج في مجالات الرياضيات والبرمجة.

في هذه المقالة، نقوم بتقديم خط أنابيب بيانات اصطناعية يهدف إلى تحسين القدرة على فهم الوثائق الطويلة. يعتمد هذا النظام على تقييم كل صفحة من الوثيقة بناءً على مدى ارتباطها بالأسئلة المطروحة، واستخراج الأدلة النصية وتصنيفها من الأكثر إلى الأقل ارتباطاً.

باستخدام تقنية SFT، يتم تطبيق هذه التتبع على علامات مخصصة، مع الحماية بواسطة رمز تحكم خاص. وتمكنت هذه الإضافات من دمج قدرات التفكير الداخلي، مما يعزز فعالية النماذج في عملية الفهم دون الحاجة إلى نماذج أكبر.

تظهر دراسة على نموذجين، Qwen3 VL 32B وMistral Small 3.1 24B، نتائج مثيرة. حيث حقق نموذج Qwen3 VL تقييماً قدره 58.3 على MMLongBenchDoc، متجاوزاً النموذج الأكبر والبالغ حجمه 235B. كما أظهرت النتائج أن استراتيجيات التفكير الاصطناعي تتفوق على طرق التقطير التقليدية، مما يتيح تحسين الأداء مع تقليل عدد الرموز الناتجة.

من خلال نشر نماذج بياناتنا، نفتح المجال لمزيد من الاستكشاف والتكرار، مما يقدم فرصة مثيرة للأبحاث المستقبلية وتحسينات في تطبيقات الذكاء الاصطناعي.