في عالم [البرمجة](/tag/البرمجة) الحديث، تلعب [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) دورًا محوريًا في [توليد الأكواد](/tag/[توليد](/tag/توليد)-الأكواد) بشكل آلي، مما يسهل حياة المبرمجين ويزيد من إنتاجيتهم. ومع ذلك، تظهر تساؤلات جادة حول [مصداقية](/tag/مصداقية) هذه [النماذج](/tag/النماذج) عند تحملها لمهام معينة، وهو ما يعرف بمشكلة "[الهلاوس](/tag/الهلاوس)".

تتعلق [الهلاوس](/tag/الهلاوس) بالقدرة المتمثلة في [توليد](/tag/توليد) أكواد تبدو صحيحة لكنها ذات [وظائف](/tag/وظائف) خاطئة أو غير فعالة. وهذا ما دفع مجموعة من [الباحثين](/tag/الباحثين) لاستكشاف إمكانيات سيتم تقديمها لتعزيز [دقة](/tag/دقة) هذه [النماذج](/tag/النماذج) وتجنُب [الأخطاء](/tag/الأخطاء).

تناولت [الدراسة](/tag/الدراسة) الأخيرة مسألة "الامتناع عن المهام"، التي تشير إلى الحاجة لنماذج [اللغات](/tag/اللغات) الضخمة ([LLMs](/tag/llms)) لتجنب [أداء](/tag/أداء) مهام معينة قد تؤدي إلى نتائج غير موثوقة. اقترح الباحثون قاعدة تمتاز بالدقة والتوازن، تستند إلى مبادئ اختبار الفرضيات المتعددة. وباستخدام هذه القاعدة، يتم [تقييم](/tag/تقييم) اتساق النتائج [عبر](/tag/عبر) [تنفيذ](/tag/تنفيذ) [الكود](/tag/الكود) ذاته، مما يساعد على التعامل مع [تنوع](/tag/تنوع) التركيب اللغوي للكود المعادل دلاليًا، دون الحاجة للاعتماد على حالات اختبار مثالية أو [قواعد بيانات](/tag/قواعد-[بيانات](/tag/بيانات)) خارجية.

وما يميز هذه النهج هو الضمانات النظرية القوية التي يوفرها، حيث أثبتت [الدراسة](/tag/الدراسة) أن هذه الطريقة تعزز من قدرة [نماذج](/tag/نماذج) الجيل على تحديد المهام الأكثر عرضة للهلاوس والامتناع عن أدائها بدقة أكبر مقارنةً بالأساليب السائدة.

وقد تم اختبار هذه الآلية على مجموعة من [مجموعات البيانات](/tag/مجموعات-[البيانات](/tag/البيانات)) القياسية بواسطة عدة [نماذج مفتوحة المصدر](/tag/[نماذج](/tag/نماذج)-مفتوحة-المصدر). والأهم من ذلك، أثبتت النتائج أن هذه الطريقة ليست فقط أكثر فعالية في تحديد المهام المعرضة للهلاوس، بل أيضًا تساهم في [تحسين](/tag/تحسين) [سلامة](/tag/سلامة) وموثوقية عمليات [توليد الأكواد](/tag/[توليد](/tag/توليد)-الأكواد).

ما رأيكم في دور [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في تعزيز [دقة](/tag/دقة) [البرمجة](/tag/البرمجة)؟ شاركونا أفكاركم في [التعليقات](/tag/التعليقات)!