تتنافس النماذج اللغوية الكبيرة (LLMs) والنماذج العالمية (World Models) في محاولة لفهم الطرق المختلفة التي يمكن بها تحقيق الذكاء العام. إن التوجه السائد في مجتمع الذكاء الاصطناعي قد صورت العلاقة بين هذين المفهومين ككائنين متضادين: حيث تُعد النماذج اللغوية المتخصصة في التنبؤ بالرموز، بينما تحاول نماذج العالم محاكاة الواقع.
يقول يان ليكون (Yann LeCun) في عام 2022 إن الوصول إلى الذكاء العام يتطلب التخلي عن أسلوب التنبؤ السطحي في الرموز، والانتقال بدلاً من ذلك نحو هندسة الفضاء الكامن (Latent-space architectures). ويشير إلى أن الفهم الثنائي لهذه العلاقة ليس ضروريًا.
في هذا الإطار، يسعى المحللون إلى الدفاع عن فكرتين رئيسيتين. أولاً، تُعتبر النماذج اللغوية الكبيرة حالة خاصة متدهورة من نماذج العالم، حيث إن الفضاء الحالى المحدد يُعد مجموعة من جميع تسلسلات الرموز، والإجراء الوحيد الممكن هو إضافة رمز واحد. وبالتالي، فإن نماذج العالم تمثل تعميقًا شديدًا لنماذج اللغة، وليس بديلًا عنها.
ثانيًا، هناك طيف طبيعي مستمر يمتد من NTP إلى JEPA، حيث تشمل محطات متعددة مثل التنبؤ بعدة رموز، وتنبؤ الملخصات المستقبلية، والتنبؤ بالفضاء الكامن التالي. كلما تقدمنا على هذا الطيف، يتم تخفيف قيود نماذج اللغة واحدًا تلو الآخر.
ويطرح الفحص في هذا السياق أيضًا مسألتين مفتوحتين على صعيد البحث، إحداهما تتعلق بالبيانات، حيث يتم الاستفسار عن الفجوة من البيانات الذاتية إلى البيئات المصنفة بالعمل، والأخرى تتعلق ببنية النموذج، هل يمكن لتكنولوجيا المحولات (Transformer) أن تعمم على التنبؤات ذات الحالة المستمرة، أم نحتاج إلى نموذج جديد تمامًا؟
إن الأفق مستمر والفرص تتوالى. ما رأيكم في هذا التطور؟ شاركونا آراءكم في التعليقات!
النماذج اللغوية: الطريق المستمر نحو الذكاء العام من خلال نماذج العالم!
تعتبر النماذج اللغوية الكبيرة (LLMs) حالة خاصة من نماذج العالم، حيث تتنبأ بتسلسل الرموز بدلاً من محاكاة الواقع. يستعرض العلماء فرصة الانتقال من هذا الإطار الضيق إلى آفاق جديدة تعزز من قدرة الذكاء الاصطناعي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
