Institute of Computing Technology, Chinese Academy IR
一种偶数基Cooley-Tukey FFT高性能实现方法 | |
龚彤艳1; 张广婷2; 贾海鹏2; 袁良2 | |
2020 | |
发表期刊 | 计算机科学 |
ISSN | 1002-137X |
卷号 | 47.0期号:1.0页码:31 |
摘要 | 快速傅里叶变换(Fast Fourier Transform,FFT)是最重要的基础算法之一,在科学计算、信号处理、图像处理等领域都有着广泛的应用。随着这些应用领域对实时性需求的进一步提高,FFT算法面临着越来越高的性能要求。在现有的FFT算法库中,FFT算法的求解速度和计算精度受到一定程度的限制,而且也少有研究者对偶数基Cooley-Tukey FFT的高性能实现提出相应的优化策略并对技术进行深入研究。基于此,文中提出了一套针对偶数基的Cooley-Tukey FFT的优化策略和方法。首先构建一个SIMD(Single Instruction Multiple Data)友好、支持混合基的蝶形网络,然后根据偶数基旋转因子特性最大限度地降低蝶形计算的复杂度,接着通过SIMD汇编优化、汇编指令重排及选择、寄存器分配策略制定、高性能矩阵转置算法等方法来优化应用,最后实现一个高性能的FFT算法库。目前,最流行、应用最广的FFT有FFTW和Intel MKL。实验结果表明,在X86计算平台上,新提出的这套针对偶数基Cooley-Tukey FFT的技术所实现的FFT算法库的性能全面优于MKL和FFTW。所提出的这套高性能算法优化和实现技术体系,可推广到除偶数基以外的其他基的实现和优化上,为进一步的研究开发工作奠定一定的基础,进而突破FFT算法在硬件平台上的性能瓶颈,实现一套针对特定平台的高性能FFT算法库。 |
关键词 | 快速傅里叶变换算法 偶数基 蝶形计算优化 蝶形网络优化 SIMD汇编优化 高性能FFT库 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/36896 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.贵州财经大学 2.中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 龚彤艳,张广婷,贾海鹏,等. 一种偶数基Cooley-Tukey FFT高性能实现方法[J]. 计算机科学,2020,47.0(1.0):31. |
APA | 龚彤艳,张广婷,贾海鹏,&袁良.(2020).一种偶数基Cooley-Tukey FFT高性能实现方法.计算机科学,47.0(1.0),31. |
MLA | 龚彤艳,et al."一种偶数基Cooley-Tukey FFT高性能实现方法".计算机科学 47.0.1.0(2020):31. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[龚彤艳]的文章 |
[张广婷]的文章 |
[贾海鹏]的文章 |
百度学术 |
百度学术中相似的文章 |
[龚彤艳]的文章 |
[张广婷]的文章 |
[贾海鹏]的文章 |
必应学术 |
必应学术中相似的文章 |
[龚彤艳]的文章 |
[张广婷]的文章 |
[贾海鹏]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论