技术详细介绍
该项目属于新一代信息技术领域。多语种混合语音中的插入语中原用语引起的非母语口音现象,不同语种的语音在发音单元、词典结构、发音风格和方式等各方面的差异,都给混合语音的识别增加了很大难度。但随着语音识别技术应用的不断推进,很多应用场合对多语种混合语音识别的需求急剧增加,特别是在新加坡这样的多语种混合说的国家、或者上海这样的国际化大都市中,其应用需求更为迫切。比如,英语作为中国人的第一外语,已经被自然而然地穿插在以汉语普通话为主的日常交流中,而且由于其表达上的便利性被越来越多的人认可,因此普通话与英语的混合语音识别也自然成为了很多用户的基本需求。因此,该项目的研发符合实际市场的需要,其成功研发能为企业带来较好的经济效益,也具备较好的社会效益。 本项目研发的混合语音识别系统,以汉语普通话与英语混合语音识别系统为主,其研发的算法和技术,可以较好地推广和应用到多种混合语音的识别任务中。其中,在混合语音识别系统的声学建模,词典构建及语言模型建模技术方面拥有自主知识产权,掌握着核心技术。 主要技术创新内容: 本项目成功研发了三项原创的关键技术:①基于数据驱动的自动合并不同语种相似音子算法;②通用混合语音声学模型自适应算法;③ 基于识别任务驱动的声学和语言模型训练方法。从附件的查新报告中看出,该项目具有较好的新颖性。 基于这三项技术搭建的普通话+英语混合的语音识别系统,从性能上看,相比较原有的单语种,即纯普通话语音识别系统而言,在混合语音识别的任务上,混合语音识别系统性能远超过纯普通话语音识别系统。另外,如果只识别英语语音,混合语音识别系统比纯普通话的语音识别系统的优势是从无到有的,有了质的提升。除了汉语普通话+英语的混合语音识别之外,研发的算法还具有较好的推广性,如果要将其应用到其他混合语种的语音识别应用中,比如粤语+普通话的混合语音,只需要做一些较小的改动即可,比如替换发音词典和模型训练语料即可。 因该项目,发表论文6篇,申请专利2项,授权专利1项。
该项目属于新一代信息技术领域。多语种混合语音中的插入语中原用语引起的非母语口音现象,不同语种的语音在发音单元、词典结构、发音风格和方式等各方面的差异,都给混合语音的识别增加了很大难度。但随着语音识别技术应用的不断推进,很多应用场合对多语种混合语音识别的需求急剧增加,特别是在新加坡这样的多语种混合说的国家、或者上海这样的国际化大都市中,其应用需求更为迫切。比如,英语作为中国人的第一外语,已经被自然而然地穿插在以汉语普通话为主的日常交流中,而且由于其表达上的便利性被越来越多的人认可,因此普通话与英语的混合语音识别也自然成为了很多用户的基本需求。因此,该项目的研发符合实际市场的需要,其成功研发能为企业带来较好的经济效益,也具备较好的社会效益。 本项目研发的混合语音识别系统,以汉语普通话与英语混合语音识别系统为主,其研发的算法和技术,可以较好地推广和应用到多种混合语音的识别任务中。其中,在混合语音识别系统的声学建模,词典构建及语言模型建模技术方面拥有自主知识产权,掌握着核心技术。 主要技术创新内容: 本项目成功研发了三项原创的关键技术:①基于数据驱动的自动合并不同语种相似音子算法;②通用混合语音声学模型自适应算法;③ 基于识别任务驱动的声学和语言模型训练方法。从附件的查新报告中看出,该项目具有较好的新颖性。 基于这三项技术搭建的普通话+英语混合的语音识别系统,从性能上看,相比较原有的单语种,即纯普通话语音识别系统而言,在混合语音识别的任务上,混合语音识别系统性能远超过纯普通话语音识别系统。另外,如果只识别英语语音,混合语音识别系统比纯普通话的语音识别系统的优势是从无到有的,有了质的提升。除了汉语普通话+英语的混合语音识别之外,研发的算法还具有较好的推广性,如果要将其应用到其他混合语种的语音识别应用中,比如粤语+普通话的混合语音,只需要做一些较小的改动即可,比如替换发音词典和模型训练语料即可。 因该项目,发表论文6篇,申请专利2项,授权专利1项。