项目编号912-2019-J002
项目名称智能语音能力平台关键技术及其在智能客服行业应用
候选单位中国科学院声学研究所
北京中科信利技术有限公司
候选人颜永红 张鹏远 徐 及 程高峰 王文超 黎 塔 周 军 赵庆卫 刘 建 王 丽
项目简介     随着我国经济的飞速发展,各个行业的企业客服业务也迅猛发展。但传统客服中心的种种缺陷严重影响业务的顺利开展,例如按键式交互系统菜单繁琐复杂、层级过深,严重影响用户体验;客户呼叫需求量巨大,现有人工坐席供不应求;传统人工质检的录音抽检率常小于1%,覆盖率很低。针对上述需求,本项目自主研发了智能语音能力平台和智能语音客服系统。极大地提高了用户交互体验,全面覆盖了企业100%的质检工作;同时可以显著减少企业客服人力,降低企业运营成本,助力企业快速发展。   主要技术创新点:   1.创新性地提出基于映射门控循环神经网络单元的新型语音识别算法,以及扩展窗输入循环神经网络算法,构建了高性能、低功耗的通用语音识别系统。所提出的语音识别算法在业界率先实现了基于单向循环神经网络的语音识别系统的性能突破。 2.提出一种高性能、高效率的可解释神经网络语言模型,构建了面向智能客服领域的低资源语言模型建模方法,克服了传统神经网络语言模型正则化复杂、梯度消失、计算效率低等问题。    3.提出了基于理想浮值掩蔽的语音信号高质量感知技术与基于无监督学习框架的语音活动度检测统计模型,对客服语音在识别前进行质量增强与自动分段,有效提升智能语音客服系统的处理效果。。   4.提出了基于共享混合高斯的概率线性判别分析模型对客服语音进行角色分离,同时提出了基于多时间尺度的深度说话人特征提取技术,并通过联合分类和距离度量学习的方法实现说话人特征的类间方差最大化和类内方差最小化,从而建构了泛化能力强、特征区分性明显的说话人识别系统。   该项目取得的创新成果包括发表论文161篇(含SCI检索36篇);获得授权发明专利34项;获得软件著作权15项;获批国家标准1项。在全国语音技术评测中多次获得第一名;在2019年第五届国际音频场景分类比赛获得第一名。该项目研发的智能语音能力平台和智能语音客服系统,打造了客服的全新模式,显著提升了我国客服领域的智能化水平。我司先后为中移在线和中国电信提供智能语音引擎,支持中移在线23个省上线智能客服语音分析系统,支持中国电信20个省上线智能客服语音导航系统。我单位与其他公司合作,已在广发银行、宁波银行、苏宁电商、平安、河北高速等60余家客户上线智能客服系统,产生直接经济效益超过九千万元。

关 闭