في ظل القوانين المعنية بالشفافية الحكومية، مثل قانون حرية المعلومات (Freedom of Information Act) في الولايات المتحدة والمملكة المتحدة، وقانون الحكومة المفتوحة (Woo) في هولندا، يُمنح المواطنون الحق في طلب الوثائق الحكومية مباشرة. لكن ماذا عن محتويات هذه الوثائق؟ غالبًا ما تحتوي على معلومات حساسة، مما يستدعي الحاجة لتعديل تلك الأجزاء قبل الإفراج عنها.
استنادًا إلى أبحاث سابقة، قام فريق من الباحثين بتطوير طريقة أوتوماتيكية لتصنيف حساسية المعلومات المتعلقة بالاستثناءات من قانون حرية المعلومات، باستخدام نماذج لغوية ضخمة (Large Language Models - LLMs). لكن المشكلة تكمن في أن معالجة الوثائق غير المعتمدة للمراجعة عبر واجهات برمجة التطبيقات السحابية غالبًا ما تكون غير قانونية أو غير مقبولة سياسيًا.
لذا، جاء الحل في استخدام نموذج محلي صغير، قابل للنشر على الأجهزة المكتبية العادية وهو Qwen3.5 9B. قام الباحثون باختبار ثمانية متغيرات لتطبيق النماذج اللغوية في تصنيف الجمل، باستخدام تقنيات شهيرة مثل الحسابات المتسلسلة (Chain-of-Thought prompting) وتقنيات التعليم القليل (few-shot prompting) مع أمثلة قائمة على الأخطاء.
وقد أظهرت النتائج أن الدمج بين هاتين الطريقتين يؤدي إلى تحقيق أداء أفضل من النماذج السابقة، حيث حققت مؤشرات تذكر واسترجاع فنية (recall وF2 score) أعلى بكثير. لم يقتصر الأمر على ذلك، بل اقتربت أداء هذه الطريقة من أداء نموذج تجاري معروف وفعال من حيث التكلفة وهو Gemini 2.5 Flash.
وتشير التحليلات الإضافية إلى أن الجمل التي يتم توقعها على أنها متعلقة بالعمليات تتضمن عددًا أكبر من الأفعال التي تعبر عن الآراء، وغالبًا ما يتم صياغتها بصيغة الشخص الأول. هذا يشير إلى أن العمليات deliberative تتحدد بوجود مجموعة من المؤشرات، خاصةً الجمع بين كلمات الشخص الأول مع فعل يعبر عن الرأي.
في ضوء هذا التطور، كيف يمكن لهذه التكنولوجيا أن تعزز من الشفافية وتحسن من أداء الحكومات في تقديم معلومات للجمهور؟
هل يجب التعديل أم لا؟ تسليط الضوء على تصنيف سرية العمليات عبر نماذج لغوية محلية!
تقدم الأبحاث الجديدة أسلوبًا مبتكرًا لتصنيف المعلومات الحساسة باستخدام نماذج لغوية محلية، مما يعزز من الشفافية الحكومية. النتائج تشير إلى أن هذه النماذج تتفوق على نماذج سابقة بمؤشرات أداء عالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
