في عالم الذكاء الاصطناعي، تعتبر نماذج اللغات الضخمة (Large Language Models) من أهم التطورات التكنولوجية في السنوات الأخيرة. ومع زيادة استخدام هذه النماذج في التطبيقات التجارية، تواجه الشركات تحديات تتعلق بكشف تفاصيل هياكلها المعمارية. على الرغم من أن معظم مزودي نماذج اللغات الضخمة لا يعلنون عن التفاصيل الأساسية لعملياتهم، استطاع الباحثون استغلال قيود واجهات البرمجة لتطوير تقنيات جديدة.

تُظهر البحوث السابقة أنه يمكن الحصول على معلومات معمارية معينة، مثل الأبعاد الخفية للشبكة والتوزيع الهرمي للنموذج، حتى مع وجود قيود على الوصول إلى واجهات البرمجة. ولقد طور الباحثون تقنية جديدة تحت اسم "NightVision"، والتي تستفيد من قيود واجهات البرمجة لتقدير الأبعاد الخفية، والعمق، وعدد المعلمات لنماذج اللغات الضخمة.

تعتمد "NightVision" على تقنية جديدة لتحفيز مجموعة مشتركة، حيث تعرض عدة نصوص احتمالات متناغمة لنفس مجموعة من الرموز الناتجة. تستخدم هذه النتائج في تحليل طيفي لاستنتاج الأبعاد الخفية. بالإضافة إلى ذلك، يتم استخدام قياسات الوقت الإجمالي للوصول إلى الرمز الأول (TTFT) مع الأبعاد المقدرة لتقدير العمق وعدد المعلمات.

تقييم "NightVision" على 32 نموذجاً مفتوح المصدر يُظهر قدرة نفس التقنية على استخراج الأبعاد الخفية بدقة ملفتة تصل إلى 23% خطأ نسبي متوسط، بما في ذلك 9% بالنسبة لنماذج Mixture of Experts (MoE).

بناءً على هذه النتائج، يبدو أن واجهات برمجة التطبيقات الحالية لا تحد من الوصول بما يكفي لإخفاء التفاصيل المعمارية بشكل كامل. هذا الاكتشاف يثير تساؤلات حول كيفية حماية المعلومات القيمة المتعلقة بالبنية التحتية لنماذج اللغات الضخمة في المستقبل، مما يستدعي مزيد من التفكير في جانب الأمان والأخلاقيات في الذكاء الاصطناعي.

ما رأيكم في هذا التطور؟ هل تعتقدون أن شركات الذكاء الاصطناعي يجب أن تكون أكثر شفافية في تفاصيل نماذجها؟ شاركونا في التعليقات.