[00334149]基于属性间依赖关系的网络表格的实体列的检测方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
通过小试
专利所属地:中国
专利号:CN201710002389.7
交易方式:
资料待完善
联系人:
北京交通大学
进入空间
所在地:北京北京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
摘要:本发明提供了一种基于属性间依赖关系的网络表格的实体列的检测方法。针对一个网络表格,根据列值间的函数依赖关系计算任意两列间的近似函数依赖概率,根据所述近似函数依赖概率获取候选函数依赖集;根据网络表格的特点,删减候选函数依赖集中的噪声函数依赖得到近似函数依赖集;对近似函数依赖集进行3NF规范化,将3NF规范化后产生的主键集合作为网络表格的实体列。本发明提供的方法能更加准确地表达属性间内在的函数依赖关系;在计算近似函数依赖时基于一致性数据和不一致性数据对函数依赖的支持度,该算法具有明显的抗噪声能力,该方法不仅适用于单实体列的网络表格,还可用于多实体列的表格。
摘要:本发明提供了一种基于属性间依赖关系的网络表格的实体列的检测方法。针对一个网络表格,根据列值间的函数依赖关系计算任意两列间的近似函数依赖概率,根据所述近似函数依赖概率获取候选函数依赖集;根据网络表格的特点,删减候选函数依赖集中的噪声函数依赖得到近似函数依赖集;对近似函数依赖集进行3NF规范化,将3NF规范化后产生的主键集合作为网络表格的实体列。本发明提供的方法能更加准确地表达属性间内在的函数依赖关系;在计算近似函数依赖时基于一致性数据和不一致性数据对函数依赖的支持度,该算法具有明显的抗噪声能力,该方法不仅适用于单实体列的网络表格,还可用于多实体列的表格。