Institute of Computing Technology, Chinese Academy IR
基于机器学习的语音驱动人脸动画方法 | |
陈益强; 高文; 王兆其; 姜大龙 | |
2003 | |
发表期刊 | 软件学报 |
ISSN | 1000-9825 |
卷号 | 14.0期号:002页码:215 |
摘要 | 语音与唇动面部表情的同步是人脸动画的难点之一,综合利用聚类和机器学习的方法学习语音信号和唇动面部表情之间的同步关系,并应用于基于MEPG-4标准的语音驱动人脸动画系统中,在大规模音视频同步数据库的基础上,利用无监督聚类发现了能有效表征人脸运动的基本模式,采用神经网络学习训练,实现了从含韵律的语音特征到人脸运动基本模式的直接映射,不仅回避了语音识别鲁棒性不高的缺陷,同时学习的结果还可以直接驱动人脸网格,最后给出对语音驱动人脸动画系统定量和定性的两种分析评价方法,实验结果表明,基于机器学习的语音驱动人脸动画不仅能有效地解决语音视频同步的难题,增强动画的真实感和副真性,同时基于MPEG-4的学习结果独立于人脸模型,还可用来驱动各种不同的人脸模型,包括真实视频,2D卡通人物以及3维虚拟人脸。 |
关键词 | 机器学习 语音驱动 人脸动画 语音识别 模式识别 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/35978 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 陈益强,高文,王兆其,等. 基于机器学习的语音驱动人脸动画方法[J]. 软件学报,2003,14.0(002):215. |
APA | 陈益强,高文,王兆其,&姜大龙.(2003).基于机器学习的语音驱动人脸动画方法.软件学报,14.0(002),215. |
MLA | 陈益强,et al."基于机器学习的语音驱动人脸动画方法".软件学报 14.0.002(2003):215. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[陈益强]的文章 |
[高文]的文章 |
[王兆其]的文章 |
百度学术 |
百度学术中相似的文章 |
[陈益强]的文章 |
[高文]的文章 |
[王兆其]的文章 |
必应学术 |
必应学术中相似的文章 |
[陈益强]的文章 |
[高文]的文章 |
[王兆其]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论