CSpace

浏览/检索结果: 共4条,第1-4条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于ARMv8平台的多维FFT实现与优化研究 期刊论文
计算机学报, 2019, 卷号: 42.0, 期号: 011, 页码: 2384
作者:  陈暾;  李志豪;  贾海鹏;  张云泉
收藏  |  浏览/下载:6/0  |  提交时间:2023/12/04
ARMv8  FFT算法  FFTW  ARMPL  SIMD优化  Cache优化  矩阵分块  
基于龙芯3A2000处理器的高性能Goto BLAS库的实现 期刊论文
高技术通讯, 2016, 卷号: 26.0, 期号: 010, 页码: 825
作者:  张华亮;  黄启印;  吴少校
收藏  |  浏览/下载:5/0  |  提交时间:2023/12/04
Goto  BLAS  性能优化  Linpack  矩阵运算  数据预取  
LU分解在Godson-Tvl众核体系结构上的半行化研究 期刊论文
计算机学报, 2009, 卷号: 32, 期号: 11, 页码: 2157
作者:  龙国平;  范东睿
收藏  |  浏览/下载:5/0  |  提交时间:2023/12/04
众核体系结构  LU分解  并行化  延迟容忍  性能模型  
HPL测试性能仿真与预测 期刊论文
计算机研究与发展, 2006, 卷号: 43.0, 期号: 003, 页码: 557
作者:  张文力;  陈明宇;  樊建平
收藏  |  浏览/下载:5/0  |  提交时间:2023/12/04
高性能Linpack测试软件包(HPL)  线性代数方程组  LU分解  MPI