[01898204]基于表格型数据生成文本的方法、装置、设备及存储介质
交易价格:
面议
所属行业:
网络
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN202010675938.9
交易方式:
技术转让
联系人:
进入空间
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明提供一种基于表格型数据生成文本的方法、装置、设备及存储介质,包括:构建数据特征表示空间,其中,所述数据特征表示空间包括记录编码层、内容选择层以及内容规划层,以实现层次化的特征表示;通过训练特征表示空间到输出向量的映射关系,构建深度生成网络;构建表格型数据到文本的生成模型;基于所述生成模型将输入的待转换的表格型数据转换为文本输出。本发明将基于层次化结构的数据特征表示与深度生成的文本生成技术融合,能够对整个表格型数据中的每条样本数据记录进行理解与推理,能够实现将结构化数据转换为全局语义连贯长文本,丰富了输入数据推理方式与输出文本表达多样性,有效提升数据到文本生成模型中BLEU与PPL等性能评测指标。
本发明提供一种基于表格型数据生成文本的方法、装置、设备及存储介质,包括:构建数据特征表示空间,其中,所述数据特征表示空间包括记录编码层、内容选择层以及内容规划层,以实现层次化的特征表示;通过训练特征表示空间到输出向量的映射关系,构建深度生成网络;构建表格型数据到文本的生成模型;基于所述生成模型将输入的待转换的表格型数据转换为文本输出。本发明将基于层次化结构的数据特征表示与深度生成的文本生成技术融合,能够对整个表格型数据中的每条样本数据记录进行理解与推理,能够实现将结构化数据转换为全局语义连贯长文本,丰富了输入数据推理方式与输出文本表达多样性,有效提升数据到文本生成模型中BLEU与PPL等性能评测指标。