Institute of Computing Technology, Chinese Academy IR
| 面向GPU的循环合并 | |
| 杨扬; 崔慧敏; 冯晓兵 | |
| 2013 | |
| 发表期刊 | 高技术通讯
![]() |
| ISSN | 1002-0470 |
| 卷号 | 23.0期号:003页码:257 |
| 摘要 | 针对现有的将C或Fortran程序映射到通用图形处理单元(GPU)的自动转换工具主要关注将单个循环生成一个独立的GPU内核,从而阻碍了对循环间数据重用的利用的问题,提出一种新的面向GPU的循环合并的代码变换方法,该方法通过循环分块(stripmining)和冗余计算等手段达到消除迭代间数据依赖的目的,并可充分利用GPU片上的共享内存进行线程间数据交换,从而将此类程序高效地映射到GPU上。通过典型程序在GPU上的实验表明,该新方法由于能够减少对全局内存的访问,带来了最多高达1.96倍的加速比。 |
| 关键词 | 通用图形处理单元(GPU) 循环合并 并行 CUDA 循环间数据重用 |
| 语种 | 英语 |
| 文献类型 | 期刊论文 |
| 条目标识符 | http://119.78.100.204/handle/2XEOYT63/33835 |
| 专题 | 中国科学院计算技术研究所期刊论文_中文 |
| 作者单位 | 中国科学院计算技术研究所 |
| 推荐引用方式 GB/T 7714 | 杨扬,崔慧敏,冯晓兵. 面向GPU的循环合并[J]. 高技术通讯,2013,23.0(003):257. |
| APA | 杨扬,崔慧敏,&冯晓兵.(2013).面向GPU的循环合并.高技术通讯,23.0(003),257. |
| MLA | 杨扬,et al."面向GPU的循环合并".高技术通讯 23.0.003(2013):257. |
| 条目包含的文件 | 条目无相关文件。 | |||||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [杨扬]的文章 |
| [崔慧敏]的文章 |
| [冯晓兵]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [杨扬]的文章 |
| [崔慧敏]的文章 |
| [冯晓兵]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [杨扬]的文章 |
| [崔慧敏]的文章 |
| [冯晓兵]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论