CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
基于机器学习的语音驱动人脸动画方法
陈益强; 高文; 王兆其; 姜大龙
2003
发表期刊软件学报
ISSN1000-9825
卷号14.0期号:002页码:215
摘要语音与唇动面部表情的同步是人脸动画的难点之一,综合利用聚类和机器学习的方法学习语音信号和唇动面部表情之间的同步关系,并应用于基于MEPG-4标准的语音驱动人脸动画系统中,在大规模音视频同步数据库的基础上,利用无监督聚类发现了能有效表征人脸运动的基本模式,采用神经网络学习训练,实现了从含韵律的语音特征到人脸运动基本模式的直接映射,不仅回避了语音识别鲁棒性不高的缺陷,同时学习的结果还可以直接驱动人脸网格,最后给出对语音驱动人脸动画系统定量和定性的两种分析评价方法,实验结果表明,基于机器学习的语音驱动人脸动画不仅能有效地解决语音视频同步的难题,增强动画的真实感和副真性,同时基于MPEG-4的学习结果独立于人脸模型,还可用来驱动各种不同的人脸模型,包括真实视频,2D卡通人物以及3维虚拟人脸。
关键词机器学习 语音驱动 人脸动画 语音识别 模式识别
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/35978
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
第一作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
陈益强,高文,王兆其,等. 基于机器学习的语音驱动人脸动画方法[J]. 软件学报,2003,14.0(002):215.
APA 陈益强,高文,王兆其,&姜大龙.(2003).基于机器学习的语音驱动人脸动画方法.软件学报,14.0(002),215.
MLA 陈益强,et al."基于机器学习的语音驱动人脸动画方法".软件学报 14.0.002(2003):215.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[陈益强]的文章
[高文]的文章
[王兆其]的文章
百度学术
百度学术中相似的文章
[陈益强]的文章
[高文]的文章
[王兆其]的文章
必应学术
必应学术中相似的文章
[陈益强]的文章
[高文]的文章
[王兆其]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。