技术详细介绍
本项目以情感分析为出发点,分析了情感信号的多视角特征,提出了多视角情感分析方法,为情感行为分析提供了解决途径;进而以此为基础,本项目对多视角学习、稀疏编码及流形正则化理论进行了深入研究,提出了多视角Hessian正则化的稀疏编码算法、多视角Hessian正则化的逻辑回归算法、Co-training法、p-Laplacian正则化的稀疏编码算法及典型相关分析算法等多种多视角学习、稀疏编码和流形正则化算法,并将这些算法应用于人脸分析、图像识别/标注、动作识别、社会行为分析等多个多媒体计算应用问题,获得了很好的应用效果。具体如下: (1)本项目提出的多部件人脸分析方法,研究了人脸不同器官及不同特征对于人脸分析的影响,并提出了解决方案,为人脸的多视角特征分析提供了有效的途径。进一步的,本项目提出的多视角稀疏编码算法,为多视角流形正则化的稀疏编码提供了解决框架,能够大大提高半监督学习环境中稀疏编码的效率和性能。 (2) 本项目将流形正则化引入到Co-Training 和典型相关分析框架中,丰富了多视角学习理论,提出的Co-Training 统一学习框架,对于Co-Training 学习有着重要的指导意义. (3)本项目在研究Hessian 正则化基础上,进一步提出了p-Laplacian 正则化方法,这是高阶流形正则化方法的进一步发展,是高阶局部结构保持方法的一种新的算法和实现手段,这一研究对于高阶局部结构保持算法具有重要的指导意义。 (4)本项目将流形正则化思想拓展到深度学习框架中,提出了Hessian 正则化的自编码方法,这一方法表明深度学习理论中考虑到样本局部结构信息将进一步的提高深度学习算法性能,为深度学习理论的发展提供了新的视角和思路。 (5)最后,本项目方法在人脸识别、表情分析、图像分类与标注、动作识别及人体行为分析中进行了大量的实验,实验结果表明本项目所提出的系列算法可以应用到多媒体计算领域并能够取得较好的实验效果。本项目算法丰富了多媒体计算领域的解决思路和技术方案,对于多媒体计算研究具有重要的指导意义。 项目发表各类期刊论文13篇(其中SCI/EI期刊12篇)、会议论文14篇,高被引论文1篇(Multiview Hessian discriminative sparse coding for image annotation, Computer Vision and Image Understanding, 2014. 他引频次168次),培养硕士毕业生3名,其中1人获得校优秀研究生论文,获山东省高等学校优秀科研成果奖三等奖1项。本项目在多视角学习、流形正则化和稀疏编码算法方面取得了一系列的进展,丰富了机器学习中的多视角学习理论、稀疏学习及流形学习理论,进一步发展了高阶流形结构保持算法,这些成果为解决多视角人脸识别、表情分析、图像分类、图像标注、视频动作识别等多媒体计算问题提供了可行的解决途径和新的研究思路。
本项目以情感分析为出发点,分析了情感信号的多视角特征,提出了多视角情感分析方法,为情感行为分析提供了解决途径;进而以此为基础,本项目对多视角学习、稀疏编码及流形正则化理论进行了深入研究,提出了多视角Hessian正则化的稀疏编码算法、多视角Hessian正则化的逻辑回归算法、Co-training法、p-Laplacian正则化的稀疏编码算法及典型相关分析算法等多种多视角学习、稀疏编码和流形正则化算法,并将这些算法应用于人脸分析、图像识别/标注、动作识别、社会行为分析等多个多媒体计算应用问题,获得了很好的应用效果。具体如下: (1)本项目提出的多部件人脸分析方法,研究了人脸不同器官及不同特征对于人脸分析的影响,并提出了解决方案,为人脸的多视角特征分析提供了有效的途径。进一步的,本项目提出的多视角稀疏编码算法,为多视角流形正则化的稀疏编码提供了解决框架,能够大大提高半监督学习环境中稀疏编码的效率和性能。 (2) 本项目将流形正则化引入到Co-Training 和典型相关分析框架中,丰富了多视角学习理论,提出的Co-Training 统一学习框架,对于Co-Training 学习有着重要的指导意义. (3)本项目在研究Hessian 正则化基础上,进一步提出了p-Laplacian 正则化方法,这是高阶流形正则化方法的进一步发展,是高阶局部结构保持方法的一种新的算法和实现手段,这一研究对于高阶局部结构保持算法具有重要的指导意义。 (4)本项目将流形正则化思想拓展到深度学习框架中,提出了Hessian 正则化的自编码方法,这一方法表明深度学习理论中考虑到样本局部结构信息将进一步的提高深度学习算法性能,为深度学习理论的发展提供了新的视角和思路。 (5)最后,本项目方法在人脸识别、表情分析、图像分类与标注、动作识别及人体行为分析中进行了大量的实验,实验结果表明本项目所提出的系列算法可以应用到多媒体计算领域并能够取得较好的实验效果。本项目算法丰富了多媒体计算领域的解决思路和技术方案,对于多媒体计算研究具有重要的指导意义。 项目发表各类期刊论文13篇(其中SCI/EI期刊12篇)、会议论文14篇,高被引论文1篇(Multiview Hessian discriminative sparse coding for image annotation, Computer Vision and Image Understanding, 2014. 他引频次168次),培养硕士毕业生3名,其中1人获得校优秀研究生论文,获山东省高等学校优秀科研成果奖三等奖1项。本项目在多视角学习、流形正则化和稀疏编码算法方面取得了一系列的进展,丰富了机器学习中的多视角学习理论、稀疏学习及流形学习理论,进一步发展了高阶流形结构保持算法,这些成果为解决多视角人脸识别、表情分析、图像分类、图像标注、视频动作识别等多媒体计算问题提供了可行的解决途径和新的研究思路。