في عالم تكنولوجيا المعلومات الطبية، تُعتبر نماذج استرجاع المعلومات المعززة (Retrieval-augmented generation - RAG) واحدة من أبرز الأدوات المستخدمة لتعزيز أداء نماذج اللغات الضخمة (Large Language Models - LLMs). تهدف هذه التقنية إلى دمج المعرفة متعددة الأبعاد التي تمتاز بها الخبرات الطبية في عملية التوليد. ومع ذلك، تظهر مخاوف حقيقية عندما تحتوي قواعد البيانات المستخدمة على معلومات مضللة، سواء كانت مضمنة بشكل طبيعي أو عن عمد، مما يُهدد موثوقية النماذج.
في هذا السياق، أظهرت الأبحاث السابقة أن أنظمة RAG الطبية معرضة لهجمات تسميم المعرفة. ومع ذلك، كانت معظم هذه الدراسات تفترض وجود معرفة مسبقة للخصوم حول استفسارات المستخدمين، وهو أمر غير واقعي في التطبيقات العملية.
لمعالجة هذه القضية، نقدم إطار العمل M³Att، الذي يركز على تصميم استراتيجي لتسميم المعرفة لأنظمة RAG الطبية مع افتراض وجود معرفة محدودة عن قاعدة البيانات الأساسية. الفكرة الأساسية هي حقن معلومات مضللة بشكل سري في البيانات النصية بينما تستخدم البيانات البصرية المصاحبة كوسيلة لتحفيز الاسترجاع بطريقة غير مرتبطة بالاستفسارات.
نقترح أولاً إطارًا موحدًا يقدم اضطرابات غير ملحوظة في المدخلات البصرية للتلاعب باحتمالات الاسترجاع. نتيجة للمعرفة الطبية المسبقة التي تمتلكها نماذج اللغات الضخمة، فإن المحتوى الطبي المسموم بشكل ساذج والذي يحتوي على أخطاء واقعية واضحة يمكن تصحيحه أثناء التوليد. لذا، نستفيد من الغموض الكامن في التشخيص الطبي ونصمم استراتيجية لحقن المعلومات المضللة تهدف إلى تقليص دقة التشخيص مع تفادي تصحيح النموذج لنفسه.
تظهر التجارب المستندة إلى خمسة نماذج لغات ضخمة ومجموعات بيانات أن إطار M³Att يستطيع الإنتاج بدرجة عالية من الدقة السريرية، رغم وجود معلومات خاطئة.
في ظل تطور الذكاء الاصطناعي، تبقى الأبحاث مستمرة لفهم هذه المخاطر والتخفيف منها. كيف ترى مستقبل التطبيقات الطبية في ظل هذه التحديات؟ شاركونا آرائكم في التعليقات!
هجمات تسميم المعرفة: تهديدات خفية لنماذج الذكاء الاصطناعي في الطب
تتزايد المخاطر المتعلقة بهجمات تسميم المعرفة في أنظمة استرجاع المعلومات المعززة بتكنولوجيا الذكاء الاصطناعي، حيث يمكن أن تؤثر هذه الهجمات على دقة النماذج المستخدمة في التطبيقات الطبية. تتضمن الدراسة الجديدة إطار عمل مبتكر للتصدي لهذه المخاطر.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
