في عالم نَماذج اللغات الضخمة (LLMs)، يتمحور النقاش الحديث حول كيفية تعريف الهوية وعملياته. قام الباحثان بيكمان وبوتلين (2026) بتطوير إطار مفاهيمي لمشكلة تمييز النماذج، مستندين إلى فرضية غير مجادَل فيها تتعلق بالتداخل بين الأنظمة. ويستند هذا الإطار إلى الأدبيات المتعلقة بشبكات الشخصيات الافتراضية، إذ يقترح أن نفس الاتجاه يحدد نفس المحتوى في سياقات مختلفة.
ومع ذلك، تكشف التجارب التي تم إجراؤها على نماذج مثل Qwen3-4B-Instruct وMistral-7B-Instruct-v0.2 عن سلسلة من التحديات التي قد تعيد التفكير في هذا الافتراض. على سبيل المثال، أظهرت التجارب أن هناك عدم توازي بين القيم المستخرجة من التحفيز ومناطق التعلم، مما يشير إلى أن الشخصيات الافتراضية قد تؤثر بشكل أكبر على النماذج مقارنةً بالشخصيات الحقيقية. بالإضافة إلى ذلك، يواجه الباحثون تحديات تتعلق بوجود مزيج من الإشارات المتناقضة، التي تميل للانجذاب نحو محاور يتم تحديدها من خلال تاريخ التدريب.
بالإضافة إلى ذلك، يظهر التباين في عمليات الجبر التراكمي، حيث تختلف حسابات وقت الاستنتاج عن تلك المستخدمة أثناء التدريب. بناءً على هذه النتائج، يقترح الباحثون نهجًا جديدًا يُعرف بتمييز الهوية حسب النظام (regime-indexed individuation)، حيث تعود وحدة الهوية إلى زوج من (وسيلة، نظام)، وليس إلى وسيلة فقط. في هذا السياق، تصف المواقف الثلاثة التي قدمها بيكمان وبوتلين كائنات متعددة داخل النظام نفسه بدلاً من التنافس على نفس المرجع.
هذا النهج الثوري يفتح آفاقًا جديدة لفهم كيفية عمل النماذج التفاعلية في ظل ظروف مختلفة ويضفي مزيدًا من العمق على الدراسات المتعلقة بالذكاء الاصطناعي وكيفية استجابته للسياقات المختلفة.
تحديات جديدة في تمييز نماذج اللغات الضخمة: رؤية مبتكرة لرسم الهوية
تقدم دراسة جديدة إطارًا نظريًا لمشكلة تمييز نماذج اللغات الضخمة (LLM)، مشيرةً إلى ضرورة الاستناد إلى سياقات تستخدم لنمذجة الهوية. النتائج تظهر ضرورة التفكير في عمليات تمييز الهوية بشكل أعمق.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
