في السنوات الأخيرة، حققت أنظمة السؤال والجواب (QA) تقدمًا ملحوظًا بفضل ظهور نماذج اللغات الضخمة (LLMs). ومع ذلك، لا تزال هذه الأنظمة تواجه تحديات كبيرة في دقة استخراج وتوليد الإجابات من السياقات المعطاة، خاصة عند التعامل مع استفسارات معقدة أو غامضة. إن الأساليب الحالية غالباً ما تعاني من ضعف الفهم السياقي، وتناسق الإجابات، والقدرة على التعميم عبر مجالات متنوعة.

في هذا البحث، نقدم نظامًا للسؤال والجواب يستند إلى نماذج اللغات الضخمة، حيث يتكون المدخل من سياق نصي وسؤال معين، أما المخرج فيكون إجابة دقيقة وموجزة. تكمن دوافع هذا البحث في معالجة القيود التي تعاني منها أنظمة الـ QA الحالية، لاسيما ميلها لإنتاج ردود غير ذات صلة أو غير دقيقة على الرغم من توفر السياق الصحيح.

تتضمن منهجيتنا تحسين نموذج LLM مُسبق التدريب على مجموعة بيانات معيارية للسؤال والجواب، لتحسين قدرته على الفهم السياقي واستخراج الإجابات. نحن نستخدم مجموعة بيانات Stanford Question Answering Dataset (SQuAD1.1)، التي توفر ثلاثيات عالية الجودة من السياق والسؤال والإجابة للتدريب والتقييم الخاضع للإشراف.

أظهرت النتائج التجريبية أن النموذج المعدل من Roberta-base يحقق أفضل أداء، حيث حصل على درجة ROUGE-L تقدر بـ 86.84%، ودرجة BLEU تبلغ 28.24%، ودرجة BERTScore تصل إلى 95.38%. تشير هذه النتائج إلى دقة عالية وملاءمة الإجابات، مما يبرز فعالية النهج المقترح في مهام السؤال والجواب المستندة إلى السياق. علاوة على ذلك، تؤكد النتائج أن التحسين المستهدف يسهم بشكل كبير في تعزيز موثوقية دقة أنظمة السؤال والجواب.