قفزة مذهلة في عالم البناء: هل ستشكل البرمجة بأسلوب Vibe مستقبل الأمان؟
تقدم طريقة البرمجة بأسلوب Vibe إمكانيات واعدة لتسهيل إنشاء الأكواد في مجال البناء، لكنها تحمل معها مخاطر كبيرة. دراسة جديدة تشير إلى وجود عيوب خطيرة في الأكواد التي أنشأتها نماذج اللغات الضخمة، مما يهدد سلامة المشاريع.
في عالم التكنولوجيا المتقدمة، تٌعد طريقة البرمجة بأسلوب Vibe مفهومًا حديثًا يتيح للمستخدمين غير التقنيين توجيه نماذج اللغات الضخمة (Large Language Models) لإنشاء أكواد قابلة للتنفيذ من خلال لغة طبيعية. ولكن، بينما تفتح هذه الطريقة آفاقًا جديدة لتمكين موظفي البناء، مثل مسؤولي السلامة والعمال، فإنها أيضًا تتسبب في ظهور مخاطر جسيمة.
دراسة جديدة قامت بتقييم تجريبي لـ 450 كودًا بلغة بايثون أنشأتها ثلاث نماذج رائدة: Claude 3.5 Haiku وGPT-4o-Mini وGemini 2.5 Flash. استخدمت الدراسة مجموعة بيانات مدفوعة بالشخصيات (n=150) مع خط أنابيب تقييم مقسم، يتضمن بيئة ديناميكية معزولة وحكمًا من قبل نماذج اللغات الضخمة.
النتائج أظهرت علاقة قوية بين شخصية المستخدم ووجود الأخطاء في البيانات، مما يشير إلى أن التعليمات غير الرسمية تؤدي إلى زيادة كبيرة في ميل الذكاء الاصطناعي لإيجاد متغيرات سلامة مفقودة. وعلى الرغم من أن النماذج أظهرت قدرة تنفيذية أساسية عالية (~85%)، إلا أن هذه الموثوقية الشكلية كانت تخفي عيوبًا منطقية وغيابًا حادًا للتقنيات الدفاعية.
تشير الإحصائيات المثيرة للقلق إلى أن ~45% من الأكواد التي تم تنفيذها بنجاح كانت تعاني من معدل فشل صامت، حيث أنتج نموذج GPT-4o-Mini نتائج رياضية غير دقيقة في ~56% من أكوده الوظيفية. هذه النتائج تعكس نقص النماذج الحالية في المتطلبات الصارمة اللازمة لمشاريع الهندسة السلامة المستقلة، مما يبرز أهمية اعتماد أنظمة ذكاء اصطناعي حازمة وإجراءات حكومية صارمة للنشر في البيئات السبرانية والفيزيائية.
دراسة جديدة قامت بتقييم تجريبي لـ 450 كودًا بلغة بايثون أنشأتها ثلاث نماذج رائدة: Claude 3.5 Haiku وGPT-4o-Mini وGemini 2.5 Flash. استخدمت الدراسة مجموعة بيانات مدفوعة بالشخصيات (n=150) مع خط أنابيب تقييم مقسم، يتضمن بيئة ديناميكية معزولة وحكمًا من قبل نماذج اللغات الضخمة.
النتائج أظهرت علاقة قوية بين شخصية المستخدم ووجود الأخطاء في البيانات، مما يشير إلى أن التعليمات غير الرسمية تؤدي إلى زيادة كبيرة في ميل الذكاء الاصطناعي لإيجاد متغيرات سلامة مفقودة. وعلى الرغم من أن النماذج أظهرت قدرة تنفيذية أساسية عالية (~85%)، إلا أن هذه الموثوقية الشكلية كانت تخفي عيوبًا منطقية وغيابًا حادًا للتقنيات الدفاعية.
تشير الإحصائيات المثيرة للقلق إلى أن ~45% من الأكواد التي تم تنفيذها بنجاح كانت تعاني من معدل فشل صامت، حيث أنتج نموذج GPT-4o-Mini نتائج رياضية غير دقيقة في ~56% من أكوده الوظيفية. هذه النتائج تعكس نقص النماذج الحالية في المتطلبات الصارمة اللازمة لمشاريع الهندسة السلامة المستقلة، مما يبرز أهمية اعتماد أنظمة ذكاء اصطناعي حازمة وإجراءات حكومية صارمة للنشر في البيئات السبرانية والفيزيائية.
