في عالم [البرمجة](/tag/البرمجة) الحديث، تلعب [نماذج [اللغات](/tag/اللغات) الضخمة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الضخمة) (Large Language [Models](/tag/models)) دورًا محوريًا في [توليد الأكواد](/tag/[توليد](/tag/توليد)-الأكواد) بشكل آلي، مما يسهل حياة المبرمجين ويزيد من إنتاجيتهم. ومع ذلك، تظهر تساؤلات جادة حول [مصداقية](/tag/مصداقية) هذه [النماذج](/tag/النماذج) عند تحملها لمهام معينة، وهو ما يعرف بمشكلة "[الهلاوس](/tag/الهلاوس)".
تتعلق [الهلاوس](/tag/الهلاوس) بالقدرة المتمثلة في [توليد](/tag/توليد) أكواد تبدو صحيحة لكنها ذات [وظائف](/tag/وظائف) خاطئة أو غير فعالة. وهذا ما دفع مجموعة من [الباحثين](/tag/الباحثين) لاستكشاف إمكانيات سيتم تقديمها لتعزيز [دقة](/tag/دقة) هذه [النماذج](/tag/النماذج) وتجنُب [الأخطاء](/tag/الأخطاء).
تناولت [الدراسة](/tag/الدراسة) الأخيرة مسألة "الامتناع عن المهام"، التي تشير إلى الحاجة لنماذج [اللغات](/tag/اللغات) الضخمة ([LLMs](/tag/llms)) لتجنب [أداء](/tag/أداء) مهام معينة قد تؤدي إلى نتائج غير موثوقة. اقترح الباحثون قاعدة تمتاز بالدقة والتوازن، تستند إلى مبادئ اختبار الفرضيات المتعددة. وباستخدام هذه القاعدة، يتم [تقييم](/tag/تقييم) اتساق النتائج [عبر](/tag/عبر) [تنفيذ](/tag/تنفيذ) [الكود](/tag/الكود) ذاته، مما يساعد على التعامل مع [تنوع](/tag/تنوع) التركيب اللغوي للكود المعادل دلاليًا، دون الحاجة للاعتماد على حالات اختبار مثالية أو [قواعد بيانات](/tag/قواعد-[بيانات](/tag/بيانات)) خارجية.
وما يميز هذه النهج هو الضمانات النظرية القوية التي يوفرها، حيث أثبتت [الدراسة](/tag/الدراسة) أن هذه الطريقة تعزز من قدرة [نماذج](/tag/نماذج) الجيل على تحديد المهام الأكثر عرضة للهلاوس والامتناع عن أدائها بدقة أكبر مقارنةً بالأساليب السائدة.
وقد تم اختبار هذه الآلية على مجموعة من [مجموعات البيانات](/tag/مجموعات-[البيانات](/tag/البيانات)) القياسية بواسطة عدة [نماذج مفتوحة المصدر](/tag/[نماذج](/tag/نماذج)-مفتوحة-المصدر). والأهم من ذلك، أثبتت النتائج أن هذه الطريقة ليست فقط أكثر فعالية في تحديد المهام المعرضة للهلاوس، بل أيضًا تساهم في [تحسين](/tag/تحسين) [سلامة](/tag/سلامة) وموثوقية عمليات [توليد الأكواد](/tag/[توليد](/tag/توليد)-الأكواد).
ما رأيكم في دور [الذكاء الاصطناعي](/tag/الذكاء-الاصطناعي) في تعزيز [دقة](/tag/دقة) [البرمجة](/tag/البرمجة)؟ شاركونا أفكاركم في [التعليقات](/tag/التعليقات)!
كيف يمكن للذكاء الاصطناعي تجنب الأخطاء في توليد الأكواد البرمجية؟
تتناول الدراسة الجديدة مشكلة الامتناع عن أداء مهام توليد الأكواد البرمجية بواسطة نماذج اللغات الضخمة (LLMs)، لتفادي ما يعرف بـ"الهلاوس". باستخدام قواعد محسوبة، توفر هذه الطريقة آلية موثوقة وأكثر أمانًا في تحسين دقة النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
