في عالم الذكاء الاصطناعي، تظل عملية استخراج المعرفة من البيانات الرمزية تحدياً كبيراً، حيث يمكن أن تؤدي هذه العملية إلى إنشاء تجريدات معرفية مصاغة بشكل رسمي، ولكنها قد تعجز عن جعلها قابلة للتفسير من قبل المستخدمين. تُعتبر عمليات تحليل المفاهيم الرسمية (Formal Concept Analysis - FCA) وتحليل المفاهيم العلائقية (Relational Concept Analysis - RCA) إحدى الطرق القوية لفهم البيانات الرمزية، إلا أن التسميات التقنية التي يتم استخدامها لتحديد المفاهيم يمكن أن تحد من إمكانية استخدامها كمعرفة مفهومة من قبل البشر.

في هذا السياق، سلط البحث الضوء على أهمية إعطاء أسماء ذات دلالات واضحة للمفاهيم الرمزية من منظور تمثيل المعرفة، حيث تم تحديد التحديات اللغوية والمصطلحية التي تواجه هذه التسميات. تتضمن هذه التحديات الغموض، التمييز، الاختصار، والتناسق بين المفاهيم ذات الصلة.

لتجاوز هذه العقبات، اقترح الباحثون إطار عمل قابلاً للتخصيص يعتمد على نماذج لغات كبيرة (Large Language Models - LLM) لمساعدتهم في إنشاء أسماء مفاهيم أكثر دلالة. يعتمد هذا الإطار على نموذج تباين يتحكم في المصادر المعلوماتية التي يتم الكشف عنها أثناء عملية التسمية، مثل النية، الامتداد، المعلومات الموروثة، المفاهيم المجاورة، والخصائص العلائقية. من خلال هذه الطريقة، يتضح الاختيارات الدلالية المتعلقة بالانتقال من أوصاف المفاهيم الرسمية إلى أسماء سهلة القراءة.

تجلى هذا النهج كإثبات للمفهوم باستخدام مجموعة بيانات صغيرة تتعلق بمجال مطاعم البيتزا، حيث أظهرت النتائج كيف تؤثر تكوينات مختلفة على الأسماء المقترحة من قبل النموذج اللغوي، وكيف يمكن أن تكشف تباين التسميات عن خيارات التفسير، والتبعيات العلائقية، والمشكلات المحتملة في النمذجة الأساسية للبيانات الرمزية.