مع تقدم العلوم البيولوجية بشكل مذهل، كانت هناك ثورة في كيفية تخزين هياكل البروتين ضمن قاعدة بيانات البروتين (Protein Data Bank - PDB). منذ أن ساهم العلماء بأكثر من 245,000 هيكل ثلاثي الأبعاد تم تحديده تجريبياً، أصبحت عملية جمع وتأكيد هذه البيانات تحديًا كبيرًا. مع توقع تلقي حوالي 19,000 رسالة من المودعين في عام 2025، كان من الضروري اتخاذ خطوة مبتكرة لتحسين كفاءة عمليات الدعم.

في هذا الإطار، تم تطوير نظام دعم يعتمد على الذكاء الاصطناعي باستخدام تقنية توليد مستندات مدعومة بالاسترجاع (Retrieval-Augmented Generation - RAG) ومدعوم بتقنية LangChain. يعتمد هذا النظام على قاعدة بيانات pgvector وGPT-4.1-mini، مما يتيح له عملية استخراج سريعة ودقيقة من مستندات PDF مع الحفاظ على تنسيق Markdown.

يعتمد النظام على طرق متطورة مثل تقسيم المستندات إلى أجزاء وتحقيق أقصى قدر من الأهمية في الاسترجاع، إضافة إلى وجود حاجز موضوعي لتصفية الاستفسارات غير المتعلقة. كما يعتمد على نظام خاص يمنع كشف المصطلحات الداخلية، مما يعزز من سرية المعلومات.

هذا النظام، الذي تم نشره على منصة Kubernetes باستخدام PostgreSQL، يوفر دعمًا على مدار الساعة للموظفين الذين يرغبون في إيداع هياكلهم، مقدمًا استجابات فورية ومعززة بالمراجع العلمية. هذه التقنية تجعل العملية أكثر سلاسة وفعالية، مما يعكس التقدم المذهل الذي يمكن تحقيقه من خلال دمج الذكاء الاصطناعي في ميادين العلوم البيولوجية.