CSpace

浏览/检索结果: 共11条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
IrGEMM: An Input-Aware Tuning Framework for Irregular GEMM on ARM and X86 CPUs 期刊论文
IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS, 2024, 卷号: 35, 期号: 9, 页码: 1672-1689
作者:  Wei, Cunyang;  Jia, Haipeng;  Zhang, Yunquan;  Yao, Jianyu;  Li, Chendi;  Cao, Wenxuan
收藏  |  浏览/下载:1/0  |  提交时间:2024/12/06
Kernel  Libraries  Computer architecture  Tuning  Layout  Optimization  Codes  Batch GEMM  code generation  compact GEMM  dynamic programming  TSMM  
Accelerated LiDAR data processing algorithm for self-driving cars on the heterogeneous computing platform 期刊论文
IET COMPUTERS AND DIGITAL TECHNIQUES, 2020, 卷号: 14, 期号: 5, 页码: 201-209
作者:  Li, Wei;  Liang, Jun;  Zhang, Yunquan;  Jia, Haipeng;  Xiao, Lin;  Li, Qing
收藏  |  浏览/下载:126/0  |  提交时间:2020/12/10
feature extraction  optical radar  optimisation  optical information processing  traffic engineering computing  mobile robots  automobiles  accelerated LiDAR data processing algorithm  self-driving cars  heterogeneous computing platform  optimisation  NVIDIA Tegra X2 computing platform  feature extraction  obstacle clustering  
Automatic Generation of High-Performance FFT Kernels on Arm and X86 CPUs 期刊论文
IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS, 2020, 卷号: 31, 期号: 8, 页码: 1925-1941
作者:  Li, Zhihao;  Jia, Haipeng;  Zhang, Yunquan;  Chen, Tun;  Yuan, Liang;  Vuduc, Richard
收藏  |  浏览/下载:65/0  |  提交时间:2020/12/10
AutoFFT  FFT  code generation  template  DFT  
一种偶数基Cooley-Tukey FFT高性能实现方法 期刊论文
计算机科学, 2020, 卷号: 47.0, 期号: 1.0, 页码: 31
作者:  龚彤艳;  张广婷;  贾海鹏;  袁良
收藏  |  浏览/下载:13/0  |  提交时间:2023/12/04
快速傅里叶变换算法  偶数基  蝶形计算优化  蝶形网络优化  SIMD汇编优化  高性能FFT库  
Efficient parallel optimizations of a high-performance SIFT on GPUs 期刊论文
JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING, 2019, 卷号: 124, 页码: 78-91
作者:  Li, Zhihao;  Jia, Haipeng;  Zhang, Yunquan;  Liu, Shice;  Li, Shigang;  Wang, Xiao;  Zhang, Hao
收藏  |  浏览/下载:81/0  |  提交时间:2019/04/03
HartSift  SIFT  CPU  High performance  Feature extraction  
基于ARMv8平台的多维FFT实现与优化研究 期刊论文
计算机学报, 2019, 卷号: 42.0, 期号: 011, 页码: 2384
作者:  陈暾;  李志豪;  贾海鹏;  张云泉
收藏  |  浏览/下载:13/0  |  提交时间:2023/12/04
ARMv8  FFT算法  FFTW  ARMPL  SIMD优化  Cache优化  矩阵分块  
ParaC:面向GPU平台的图像处理领域的编程框架 期刊论文
软件学报, 2017, 卷号: 28.0, 期号: 007, 页码: 1655
作者:  卢兴敬;  刘雷;  贾海鹏;  冯晓兵;  武成岗
收藏  |  浏览/下载:13/0  |  提交时间:2023/12/04
图像处理  通用GPU加速器  领域编程语言  编译优化  源源变换  
Parallel Processing Systems for Big Data: A Survey 期刊论文
PROCEEDINGS OF THE IEEE, 2016, 卷号: 104, 期号: 11, 页码: 2114-2136
作者:  Zhang, Yunquan;  Cao, Ting;  Li, Shigang;  Tian, Xinhui;  Yuan, Liang;  Jia, Haipeng;  Vasilakos, Athanasios V.
收藏  |  浏览/下载:62/0  |  提交时间:2019/12/13
Big data  machine learning  MapReduce  parallel processing  SQL  survey  
基于OpenCL的Viola-Jones人脸检测算法性能优化研究 期刊论文
计算机学报, 2016, 卷号: 39.0, 期号: 009, 页码: 1775
作者:  贾海鹏;  张云泉;  袁良;  李士刚
收藏  |  浏览/下载:12/0  |  提交时间:2023/12/04
OpenCL  负载不均衡  任务队列  线程与任务动态映射  性能移植  
基于OpenCL的直方图生成算法优化方法研究 期刊论文
计算机科学, 2015, 卷号: 42.0, 期号: 011, 页码: 32
作者:  安小景;  张云泉;  贾海鹏
收藏  |  浏览/下载:10/0  |  提交时间:2023/12/04
GPGPU  OpenCL  数据本地化  直方图生成