中证网
返回首页

中国语音产业联盟发布《中国智能语音产业发展报告(2021-2022)》

王珞 中国证券报·中证网

  中证网讯(王珞)1月11日,由国家工业信息安全发展研究中心主办,科大讯飞、国家语音及图像识别产品质量检验检测中心、国家智能语音创新中心协办的中国智能语音产业发展高峰论坛暨2022年中国语音产业联盟年会成功举办。会上,中国语音产业联盟发布《中国智能语音产业发展报告(2021-2022)》。报告指出,我国智能语音产业整体发展环境积极向好,多项关键技术取得突破,产业扎根不断深入,已形成大中小企业融通创新、协同发展的健康生态。

  报告指出,以科大讯飞为代表的语音龙头企业布局较广,是行业创新发展的支柱,占据较大市场份额。同时,科大讯飞、百度、阿里等龙头企业通过打造技术能力开放平台,构建开源生态,引领行业技术创新和应用开发。以讯飞开放平台为例,目前已开放545项AI产品及能力,聚集超过380.5万开发者团队,开发出超过159.5万个AI应用,并从AI龙头+开发者的“二维”生态,升级到AI龙头+行业龙头+开发者的“三维”生态,联合行业龙头搭建基线系统,让更多开发者参与到数字经济浪潮中。

  在语音识别方面,视听融合的多模态交互技术成为技术演进的主要方向。科大讯飞多模语音增强技术融合语音与视觉的多模感知,让高噪音场景下的语音交互跨过实用门槛,率先在车载、会议、地铁购票和医疗挂号等场景落地。此外,针对低资源语音识别难题,海天瑞声和科大讯飞分别从语音数据和算法层面推动技术进步。

  在语音合成方面,随着电商直播等行业的繁荣,语音合成技术也表现出拟人化、口语化的发展趋势。科大讯飞多风格多情感语音合成系统SMART-TTS可提供11种强度可调的情感合成能力。而火山语音的超自然对话语音合成和META的语音对语音翻译(speech-to-speech translation, S2ST),通过在模型训练中添加副语言数据,让语音交互更加自然和个性化。

  关于促进智能语音技术持续突破,科大讯飞总裁吴晓如在会上称,更先进的语音交互系统不仅要“能听会说”,还要深度理解人的信息。

  展望智能语音产业未来发展,报告认为,后竞争时代亟需关注新增的不确定性因素,包括:核心关键技术能力仍需提升,开源生态培育仍需加大投入,重点应用场景落地仍需提速,传统行业开放场景动能不足等。

中证网声明:凡本网注明“来源:中国证券报·中证网”的所有作品,版权均属于中国证券报、中证网。中国证券报·中证网与作品作者联合声明,任何组织未经中国证券报、中证网以及作者书面授权不得转载、摘编或利用其它方式使用上述作品。