[01702920]大数据驱动的云计算平台及其在统计学中的应用
交易价格:
面议
所属行业:
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该项目为了提升平台处理大数据的速度,对统计算法中的图模型的参数估计和模型选择问题进行了研究。基于云平台的参数估计问题给出了基于团集分组策略求高斯图模型和层次模型参数估计的IPSP算法,为云平台上的大数据处理降低计算次数,提高处理数据的速度。
证明了算法得到的解与传统的IPS算法的解相同;
利用模拟退火求近似最优团分组,进而使复杂度降到近似最低;
讨论了分组策略与连接树(junction tree)策略的关系,并给出了两者结合的IPSMP和IPSP-JT,进一步降低复杂度;
通过模拟发现,对于高维模型IPSP比IPS计算速度快近10倍,IPSP可以计算含6,000多个变量的图模型的极大似然估计,而IPS仅可以计算200个变量模型的估计;进一步,IPSMP和IPSP-JT比IPSP的速度还要快,但需要大量内存;
分析了6,320个基因的微阵列数据,利用IPSP求解极大似然估计,度量基因间的条件相关性。
该项目为了提升平台处理大数据的速度,对统计算法中的图模型的参数估计和模型选择问题进行了研究。基于云平台的参数估计问题给出了基于团集分组策略求高斯图模型和层次模型参数估计的IPSP算法,为云平台上的大数据处理降低计算次数,提高处理数据的速度。
证明了算法得到的解与传统的IPS算法的解相同;
利用模拟退火求近似最优团分组,进而使复杂度降到近似最低;
讨论了分组策略与连接树(junction tree)策略的关系,并给出了两者结合的IPSMP和IPSP-JT,进一步降低复杂度;
通过模拟发现,对于高维模型IPSP比IPS计算速度快近10倍,IPSP可以计算含6,000多个变量的图模型的极大似然估计,而IPS仅可以计算200个变量模型的估计;进一步,IPSMP和IPSP-JT比IPSP的速度还要快,但需要大量内存;
分析了6,320个基因的微阵列数据,利用IPSP求解极大似然估计,度量基因间的条件相关性。