في عصر الذكاء الاصطناعي، تعتبر نماذج اللغات الضخمة (Large Language Models) أداة قوية، لكن تواجهها تحديات مثل ندرة الحوارات المعقدة والموجهة نحو المهام. يكشف البحث الجديد عن إطار STREAM الذي يعتمد على البيانات لاستثمار وسائط البث العامة (Streaming Media) مثل البث المباشر ومقاطع الفيديو القصيرة.
تعتبر عمليات جمع البيانات التقليدية محاطة بـ "ثلاثة مشاكل"؛ فهي تتطلب تعليقات خبراء مكلفة، وتواجه قيودًا خصوصية تجارية، وتصبح البيانات الثابتة قديمة بسرعة. ولكن مع STREAM، يمكننا استغلال إشارات التفاعل الحقيقية من التدفقات غير المنظمة، مما يساعد في توليد حوارات خدمية بمقياس كبير.
يعتمد إطار STREAM على بناء الشخصيات الموجهة بالوظائف مع خريطة المحادثات (Conversational Blueprint)، بالإضافة إلى استخدام تقنية الجيل المدعوم بالاسترجاع (RAG) لضمان ردود تعرف على المعرفة. يتضمن هذا الإطار مجموعة بيانات جديدة تُسمى StreamDial، والتي تغطي مجالات متعددة مثل السيارات، المطاعم، والفنادق.
تحتوي StreamDial على 87,498 جلسة حوارية و1,497,320 تفاعل في المجموع، مما يوفر ميزة التفاعل المتوازن عبر مختلف المجالات. تتضمن كل جلسة هيكلًا محددًا يربط تاريخ الحوار بشخصيات المستخدم والعميل، مما يعكس سلوكيات الخدمة الواقعية مثل استخراج المتطلبات، والنزاعات، والتفاوض، والتعافي.
تشير التقييمات مع القضاة الآليين والمهام التالية إلى تحسين جودة الحوار الداخلية بفضل StreamDial. بالإضافة إلى ذلك، تؤدي النماذج المدربة به تحسينًا في تتبع حالة الحوار عبر برامج متنوعة، مع تقارير مشجعة عن النقل متعدد اللغات تحت ميزانية تدريب مسيطر عليها. للمهتمين، البيانات متاحة على الرابط https://github.com/hitxueliang/DialogDataSetBySTREAM.
اكتشاف حوارات ذات قيمة عالية: إطار STREAM الجديد يعتمد على البيانات!
تقدم تقنية STREAM إطارًا ثوريًا لتحليل الحوارات المهمة من وسائط البث، مما يعالج التحديات التقليدية في جمع البيانات. مع إصدار مجموعة بيانات StreamDial، يجب أن تكون الحوارات المستقبلية أكثر جودة وابتكارًا.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
