في عالم [التعلم الآلي](/tag/[التعلم](/tag/التعلم)-الآلي) المتسارع، يُعتبر [ضمان الجودة](/tag/ضمان-الجودة) ([Quality Assurance](/tag/quality-assurance)) عنصرًا أساسيًا في [تطوير](/tag/تطوير) [نماذج](/tag/نماذج) فعّالة ودقيقة. ومع ذلك، تقترح [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) ضرورة تركيز المجتمع العلمي على [ضمان الجودة](/tag/ضمان-الجودة) في مراحل مبكرة من عمليات التهيئة بدلاً من الاعتماد المتزايد على المراجعة النهائية.

تتناول هذه الورقة أهمية تجنب اختناقات [جودة البيانات](/tag/جودة-[البيانات](/tag/البيانات)) التي قد تؤثر سلبًا على [تحسين](/tag/تحسين) [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models))، حيث تبرز مشكلة متعلقة بوقوع [الأخطاء](/tag/الأخطاء) في مراحل متأخرة، مما يؤدي إلى [تكاليف](/tag/تكاليف) أعلى وأعداد أكبر من [الأخطاء](/tag/الأخطاء).

تعتمد الفكرة الرئيسية على مبدأ "shift-left" في [هندسة](/tag/هندسة) البرمجيات، حيث تكشف الدراسات عن [تكاليف](/tag/تكاليف) تفوق 4 إلى 100 مرة للأخطاء المكتشفة في مراحل متأخرة. هذا يتماشى مع الديناميات المعقدة لعمليات التهيئة، حيث يمكن أن تكلف [الأخطاء](/tag/الأخطاء) المكتشفة قبل بدء التهيئة جزءًا بسيطًا من تلك المكتشفة بعد انتهاء دورات المراجعة.

تقترح [الدراسة](/tag/الدراسة) تصنيفًا لـثلاث نقاط رئيسية في ضمان الجودة، وهي قبل التهيئة (T0)، بعد التهيئة (T1)، وبعد المراجعة (T2)، مما يعزز فهمنا للعوامل التي تؤثر في [جودة البيانات](/tag/جودة-[البيانات](/tag/البيانات)). للأسف، أظهرت [دراسة](/tag/دراسة) لـ47 ورقة بحثية أن 4% فقط منها تتناول وقت التحقق، مما يعكس هوة كبيرة في [المعرفة](/tag/المعرفة) حيث يمكن أن يؤثر [التوقيت](/tag/التوقيت) على النتائج النهائية.

لذا، يتعين على [الباحثين](/tag/الباحثين) الإبلاغ عن تكوينات وقت [ضمان الجودة](/tag/ضمان-الجودة) بجانب طرق التحقق، ويجب على [منصات](/tag/منصات) التهيئة تيسير الوقت كمعامل أساسي، ومن الضروري إجراء [تجارب](/tag/تجارب) محكومة لقياس معدلات الكشف المرحلة بدقة. في سعي المجتمع لرفع المستوى، من الضروري أيضاً إيلاء اهتمام أكبر لهذا العامل الهيكلي.