في عالم الذكاء الاصطناعي، يبرز دور نماذج اللغات الكبيرة (Large Language Models - LLMs) كأداة رئيسية في مجالات متعددة، ودورها في تصميم الخوارزميات يتجلى كأحد أكثر المجالات واعدة. تسلط دراسة جديدة الضوء على كيفية تعديل هذه النماذج لتحسين أداء الخوارزميات المُصممة تلقائيًا.
تتضمن الاستراتيجية المتبعة دمج نماذج اللغات الكبيرة ضمن روتين البحث، حيث يتم توليد خوارزميات مرشحة وتحسينها بشكل متكرر. ومع ذلك، تبين أن الكثير من الطرق الحالية تستخدم نماذج مُعدة مسبقًا لمهام التشفير العامة، مما يطرح تساؤلات حول الحاجة إلى نماذج متخصصة تُستخدم في تصميم الخوارزميات. في هذا السياق، نقدم خطوات أولية للإجابة عن هذه الأسئلة.
تستند الدراسة إلى استراتيجية عينة تعتمد على التنوع (Diversity-Aware Rank-based - DAR) لتحقيق توازن بين تنوع وجودة بيانات التدريب، مع الاستفادة من تحسين التفضيلات المباشرة (Direct Preference Optimization) لتحقيق توافق فعال بين مخرجات LLM واحتياجات المهام.
تركز التجارب التي تم إجراؤها على نموذجين: Llama-3.2-1B-Instruct وLlama-3.1-8B-Instruct، حيث تم إجراؤها عبر ثلاثة مهام مختلفة لتصميم الخوارزميات. أظهرت النتائج أن نماذج LLM المعدلة يمكن أن تتفوق بشكل كبير على نظرائها الجاهزين، خاصة مع النموذج الأصغر، ويمكن أيضاً أن تتساوى في الأداء مع النموذج الأكبر في بعض القضايا.
علاوة على ذلك، أظهرت النتائج واعدة فيما يخص عموميات الأداء: حيث يمكن لنماذج LLM المعدلة لمهام تصميم خوارزمية معينة تحسين الأداء أيضًا في مهام ذات صلة بإعدادات متنوعة. تؤكد هذه النتائج على أهمية التكيف المتخصص للمهام في تطوير نماذج اللغات الكبيرة لتعزيز تصميم الخوارزميات، مما يمهد الطريق أمام أفق بحث جديد في هذا المجال.
للمزيد من المعلومات، يمكنكم الاطلاع على الكود المصدر المتاح علنًا على GitHub.
ثورة الذكاء الاصطناعي: تعديل نماذج اللغات الكبيرة لتصميم الخوارزميات تلقائيًا
تظهر دراسات جديدة إمكانيات واعدة لتعديل نماذج اللغات الكبيرة (LLMs) لتصميم الخوارزميات. تكشف النتائج أن هذه النماذج المخصصة يمكن أن تتفوق على النماذج التقليدية، مما يفتح آفاقًا جديدة للبحث المستقبلي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
