في عالم الذكاء الاصطناعي، يبرز دور [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) (Large Language [Models](/tag/models) - [LLMs](/tag/llms)) كأداة رئيسية في مجالات متعددة، ودورها في [تصميم الخوارزميات](/tag/[تصميم](/tag/تصميم)-[الخوارزميات](/tag/الخوارزميات)) يتجلى كأحد أكثر المجالات واعدة. تسلط [دراسة جديدة](/tag/[دراسة](/tag/دراسة)-جديدة) الضوء على كيفية تعديل هذه [النماذج](/tag/النماذج) لتحسين [أداء](/tag/أداء) [الخوارزميات](/tag/الخوارزميات) المُصممة تلقائيًا.

تتضمن الاستراتيجية المتبعة دمج [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) ضمن روتين البحث، حيث يتم [توليد](/tag/توليد) [خوارزميات](/tag/خوارزميات) مرشحة وتحسينها بشكل متكرر. ومع ذلك، تبين أن الكثير من الطرق الحالية تستخدم [نماذج](/tag/نماذج) مُعدة مسبقًا لمهام [التشفير](/tag/التشفير) العامة، مما يطرح تساؤلات حول الحاجة إلى [نماذج](/tag/نماذج) متخصصة تُستخدم في [تصميم الخوارزميات](/tag/[تصميم](/tag/تصميم)-[الخوارزميات](/tag/الخوارزميات)). في هذا السياق، نقدم خطوات أولية للإجابة عن هذه الأسئلة.

تستند [الدراسة](/tag/الدراسة) إلى [استراتيجية](/tag/استراتيجية) [عينة](/tag/عينة) تعتمد على [التنوع](/tag/التنوع) (Diversity-Aware Rank-based - DAR) لتحقيق توازن بين [تنوع](/tag/تنوع) وجودة [بيانات](/tag/بيانات) التدريب، مع الاستفادة من [تحسين التفضيلات](/tag/[تحسين](/tag/تحسين)-[التفضيلات](/tag/التفضيلات)) المباشرة (Direct Preference [Optimization](/tag/optimization)) لتحقيق [توافق](/tag/توافق) فعال بين مخرجات [LLM](/tag/llm) واحتياجات المهام.

تركز [التجارب](/tag/التجارب) التي تم إجراؤها على نموذجين: [Llama](/tag/llama)-3.2-1B-Instruct وLlama-3.1-8B-Instruct، حيث تم إجراؤها [عبر](/tag/عبر) ثلاثة مهام مختلفة لتصميم [الخوارزميات](/tag/الخوارزميات). أظهرت النتائج أن [نماذج](/tag/نماذج) [LLM](/tag/llm) المعدلة يمكن أن تتفوق بشكل كبير على نظرائها الجاهزين، خاصة مع النموذج الأصغر، ويمكن أيضاً أن تتساوى في [الأداء](/tag/الأداء) مع النموذج الأكبر في بعض القضايا.

علاوة على ذلك، أظهرت النتائج واعدة فيما يخص عموميات [الأداء](/tag/الأداء): حيث يمكن لنماذج [LLM](/tag/llm) المعدلة لمهام [تصميم](/tag/تصميم) [خوارزمية](/tag/خوارزمية) معينة [تحسين الأداء](/tag/[تحسين](/tag/تحسين)-[الأداء](/tag/الأداء)) أيضًا في مهام ذات صلة بإعدادات متنوعة. تؤكد هذه النتائج على أهمية [التكيف](/tag/التكيف) المتخصص للمهام في [تطوير](/tag/تطوير) [نماذج [اللغات](/tag/اللغات) الكبيرة](/tag/[نماذج](/tag/نماذج)-[اللغات](/tag/اللغات)-الكبيرة) لتعزيز [تصميم](/tag/تصميم) الخوارزميات، مما يمهد الطريق أمام أفق [بحث](/tag/بحث) [جديد](/tag/جديد) في هذا المجال.

للمزيد من المعلومات، يمكنكم الاطلاع على [الكود](/tag/الكود) المصدر المتاح علنًا على [GitHub](https://github.com/RayZhhh/dpo-aad).