[00251626]一种基于汉语简单名词短语的汉语最长名词短语识别方法
交易价格:
面议
所属行业:
其他电子信息
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610317795.8
交易方式:
技术转让
技术转让
技术入股
联系人:
科小易
进入空间
所在地:福建厦门市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明属于人工智能的自然语言处理子领域,提供了一种基于汉语简单名词短语的汉语最长名词短语识别方法。包括如下步骤:S1数据预处理;S2选用SVM方法,训练汉语SNP识别模型,识别出汉语SNP;S3使用缩略替换方法简化文本,得到新的训练及测试语料;S4在经S3处理得到的新语料中,再次提取样本集,针对简化后的汉语MNP进行模型训练、识别;S5还原语料,还原后的汉语MNP为本方法最终识别结果。本发明的汉语MNP识别方法可以降低汉语MNP在自动识别中因其长度过长、语义及结构复杂等因素带来的不利影响,因此能有效提高汉语MNP的识别效果。
本发明属于人工智能的自然语言处理子领域,提供了一种基于汉语简单名词短语的汉语最长名词短语识别方法。包括如下步骤:S1数据预处理;S2选用SVM方法,训练汉语SNP识别模型,识别出汉语SNP;S3使用缩略替换方法简化文本,得到新的训练及测试语料;S4在经S3处理得到的新语料中,再次提取样本集,针对简化后的汉语MNP进行模型训练、识别;S5还原语料,还原后的汉语MNP为本方法最终识别结果。本发明的汉语MNP识别方法可以降低汉语MNP在自动识别中因其长度过长、语义及结构复杂等因素带来的不利影响,因此能有效提高汉语MNP的识别效果。