技术详细介绍
1.课题来源与背景:随着信息技术的发展和电子商务应用的深入,数据正以前所未有的速度剧增,数据类型也变得越来越复杂。海量多源异构数据的深度分析和利用,有利于构建企业级智能化应用,以更加贴近消费者的最真实需求,从而提升企业的竞争力。有鉴于此,本项目在国家自然科学基金、科技支撑计划、软科学研究计划项目等资助下,围绕聚合数据管理平台中若干关键技术问题开展深入研究,并取得了多项具有自主知识产权的技术成果。 2.技术原理及性能指标:本项目着眼于电子商务企业所积累的海量多源异构数据,突破了数据采集和预处理、数据存储和管理、数据挖掘和分析以及平台支撑等4项关键技术,实现了电子商务数据聚合管理平台的研制,在理论创新与技术研发方面皆取得了系列原创新成果。申请国家发明专利48项,14项获得授权,其中2项专利经过成果转让方式,成功应用到企业产品开发中;发表论文62篇,其中SCI期刊收录17篇,EI收录21篇。项目技术成果已在多家知名电子商务企业中得到产业化应用,证明其市场竞争力强,成果转化程度高。 3.技术创造性与先进性:本项目主要科技创新如下:数据采集和预处理技术:在企业运营和社会网络数据获取方面,采用主题集中式万维网爬虫设置方法,缩减了时间开销;针对利用感知式系统获取数据逐渐流行、且对数据采集实时性要求高的现状,提出一种基于物联网的实时数据采集技术,在保证安全性与可靠性的前提下提高了数据采集效率与质量,降低了实现成本。同时采用基于兴趣模式挖掘的噪音数据过滤等方法实现数据预处理,提高了数据质量;数据存储和管理技术:除了传统结构化程度高的数据,企业需要处理越来越多的半/非结构化数据,在半/非结构化数据的可信存储、索引和检索研制出一系列技术成果,不仅丰富和完善了半/非结构化数据管理领域的研究,而且为企业高效管理海量的半/非结构化数据提供了技术途径;数据挖掘和分析技术:研发了多种高效的数据挖掘和分析算法,具体涉及聚类分析、社区抽取、文本分类、可信推荐,成功解决了“零值困境”、“模式泛滥”、社区网络局部结构的高复杂性、不均匀文本数据自动分类存在偏差、冷启动用户推荐准确性以及托攻击的难题,为企业的生产经营管理活动提供决策支持;应用平台支撑技术:从分布式计算模型、动态对称事件匹配、三维可视化等方面展开攻关,形成了一系列创新性的技术成果,构建了电子商务数据聚合管理平台,大幅度提升了智能企业大规模数据数据处理能力,实现了智能化的决策、控制和服务,具有显著的经济和社会效益。 4.推广应用情况:通过电子商务数据聚合管理平台的开发和产业化应用,形成了产学研一体化的良性循环运转机制。多项自主研发成果在江苏省众多电子商务企业得到产业化应用,大力促进了行业科技进步,形成了整体技术优势,市场需求旺盛,具有显著的市场竞争优势。
1.课题来源与背景:随着信息技术的发展和电子商务应用的深入,数据正以前所未有的速度剧增,数据类型也变得越来越复杂。海量多源异构数据的深度分析和利用,有利于构建企业级智能化应用,以更加贴近消费者的最真实需求,从而提升企业的竞争力。有鉴于此,本项目在国家自然科学基金、科技支撑计划、软科学研究计划项目等资助下,围绕聚合数据管理平台中若干关键技术问题开展深入研究,并取得了多项具有自主知识产权的技术成果。 2.技术原理及性能指标:本项目着眼于电子商务企业所积累的海量多源异构数据,突破了数据采集和预处理、数据存储和管理、数据挖掘和分析以及平台支撑等4项关键技术,实现了电子商务数据聚合管理平台的研制,在理论创新与技术研发方面皆取得了系列原创新成果。申请国家发明专利48项,14项获得授权,其中2项专利经过成果转让方式,成功应用到企业产品开发中;发表论文62篇,其中SCI期刊收录17篇,EI收录21篇。项目技术成果已在多家知名电子商务企业中得到产业化应用,证明其市场竞争力强,成果转化程度高。 3.技术创造性与先进性:本项目主要科技创新如下:数据采集和预处理技术:在企业运营和社会网络数据获取方面,采用主题集中式万维网爬虫设置方法,缩减了时间开销;针对利用感知式系统获取数据逐渐流行、且对数据采集实时性要求高的现状,提出一种基于物联网的实时数据采集技术,在保证安全性与可靠性的前提下提高了数据采集效率与质量,降低了实现成本。同时采用基于兴趣模式挖掘的噪音数据过滤等方法实现数据预处理,提高了数据质量;数据存储和管理技术:除了传统结构化程度高的数据,企业需要处理越来越多的半/非结构化数据,在半/非结构化数据的可信存储、索引和检索研制出一系列技术成果,不仅丰富和完善了半/非结构化数据管理领域的研究,而且为企业高效管理海量的半/非结构化数据提供了技术途径;数据挖掘和分析技术:研发了多种高效的数据挖掘和分析算法,具体涉及聚类分析、社区抽取、文本分类、可信推荐,成功解决了“零值困境”、“模式泛滥”、社区网络局部结构的高复杂性、不均匀文本数据自动分类存在偏差、冷启动用户推荐准确性以及托攻击的难题,为企业的生产经营管理活动提供决策支持;应用平台支撑技术:从分布式计算模型、动态对称事件匹配、三维可视化等方面展开攻关,形成了一系列创新性的技术成果,构建了电子商务数据聚合管理平台,大幅度提升了智能企业大规模数据数据处理能力,实现了智能化的决策、控制和服务,具有显著的经济和社会效益。 4.推广应用情况:通过电子商务数据聚合管理平台的开发和产业化应用,形成了产学研一体化的良性循环运转机制。多项自主研发成果在江苏省众多电子商务企业得到产业化应用,大力促进了行业科技进步,形成了整体技术优势,市场需求旺盛,具有显著的市场竞争优势。