Institute of Computing Technology, Chinese Academy IR
基于OpenCL的Viola-Jones人脸检测算法性能优化研究 | |
贾海鹏; 张云泉; 袁良; 李士刚 | |
2016 | |
发表期刊 | 计算机学报 |
ISSN | 0254-4164 |
卷号 | 39.0期号:009页码:1775 |
摘要 | Viola-Jones人脸检测算法是最为成功的可实用的人脸检测算法之一.然而,随着该算法所在领域数据处理规模的不断扩大,现有算法的性能已经越来越无法满足日益增长的交互性与实时性要求.使用GPU计算平台提升该算法性能,以满足日益增长的实时性要求已经成为研究热点.然而,该算法在对GPU的实现和优化中,存在线程间负载不均衡的非规则特性,如果仅使用传统的优化方法,则难以在GPU计算平台上达到较高性能.针对此种情况,该文构建了针对此类算法的并行优化框架,通过Uberkernel、粗粒度并行、Persistent Thread、线程与数据的动态映射、全局及本地队列等优化方法的应用,突破了负载不均衡非规则特性导致的性能瓶颈,大幅提高了人脸检测算法在GPU计算平台上的性能.同时,该文通过对不同GPU计算平台关键性能参数的定义、抽取和传递,实现了该算法在不同GPU计算平台间的性能移植.实验结果表明,与OpenCV2.4中经过高度优化的CPU版本在Intel Xeon X5550CPU上的性能相比,优化后的算法在AMD HD7970和NVIDIA GTX680两个不同GPU计算平台上分别达到了11.24-20.27和9.24-17.62倍的加速比,不仅实现了高性能,而且实现了在不同GPU计算平台间的性能移植. |
关键词 | OpenCL 负载不均衡 任务队列 线程与任务动态映射 性能移植 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/34622 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 贾海鹏,张云泉,袁良,等. 基于OpenCL的Viola-Jones人脸检测算法性能优化研究[J]. 计算机学报,2016,39.0(009):1775. |
APA | 贾海鹏,张云泉,袁良,&李士刚.(2016).基于OpenCL的Viola-Jones人脸检测算法性能优化研究.计算机学报,39.0(009),1775. |
MLA | 贾海鹏,et al."基于OpenCL的Viola-Jones人脸检测算法性能优化研究".计算机学报 39.0.009(2016):1775. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[贾海鹏]的文章 |
[张云泉]的文章 |
[袁良]的文章 |
百度学术 |
百度学术中相似的文章 |
[贾海鹏]的文章 |
[张云泉]的文章 |
[袁良]的文章 |
必应学术 |
必应学术中相似的文章 |
[贾海鹏]的文章 |
[张云泉]的文章 |
[袁良]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论