CSpace

浏览/检索结果: 共27条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
CUTE: A scalable CPU-centric and Ultra-utilized Tensor Engine for convolutions 期刊论文
JOURNAL OF SYSTEMS ARCHITECTURE, 2024, 卷号: 149, 页码: 15
作者:  Li, Wenqing;  Ye, Jinpeng;  Zhang, Fuxin;  Liu, Tianyi;  Zhang, Tingting;  Wang, Jian
收藏  |  浏览/下载:0/0  |  提交时间:2024/05/20
Tensor engine  Convolution  Scalable architecture  CPU-centric  Utilization  
Mortar-FP8: Morphing the Existing FP32 Infrastructure for High-Performance Deep Learning Acceleration 期刊论文
IEEE TRANSACTIONS ON COMPUTER-AIDED DESIGN OF INTEGRATED CIRCUITS AND SYSTEMS, 2024, 卷号: 43, 期号: 3, 页码: 878-891
作者:  Li, Hongyan;  Lu, Hang;  Li, Xiaowei
收藏  |  浏览/下载:0/0  |  提交时间:2024/05/20
Deep learning accelerator  deep neural network (DNN)  fp8 format  
AKGF: Automatic Kernel Generation for DNN on CPU-FPGA 期刊论文
COMPUTER JOURNAL, 2023, 页码: 9
作者:  Dong, Dong;  Jiang, Hongxu;  Diao, Boyu
收藏  |  浏览/下载:6/0  |  提交时间:2023/12/04
DNN accelerated compilers  polyhedral model  heterogeneous computing  CPU-FPGA  
MJOA-MU: End-to-edge collaborative computation for DNN inference based on model uploading 期刊论文
COMPUTER NETWORKS, 2023, 卷号: 231, 页码: 17
作者:  Yang, Huan;  Sun, Sheng;  Liu, Min;  Zhang, Qiuping;  Wang, Yuwei
收藏  |  浏览/下载:6/0  |  提交时间:2023/12/04
DNN inference  Model uploading  DNN partitioning  Resource allocation  
BitXpro: Regularity-Aware Hardware Runtime Pruning for Deep Neural Networks 期刊论文
IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, 2023, 卷号: 31, 期号: 1, 页码: 90-103
作者:  Li, Hongyan;  Lu, Hang;  Wang, Haoxuan;  Deng, Shengji;  Li, Xiaowei
收藏  |  浏览/下载:11/0  |  提交时间:2023/07/12
Deep learning accelerator  deep neural network (DNN)  hardware runtime pruning  
CAP: Communication-Aware Automated Parallelization for Deep Learning Inference on CMP Architectures 期刊论文
IEEE TRANSACTIONS ON COMPUTERS, 2022, 卷号: 71, 期号: 7, 页码: 1626-1639
作者:  Zou, Kaiwei;  Wang, Ying;  Cheng, Long;  Qu, Songyun;  Li, Huawei;  Li, Xiaowei
收藏  |  浏览/下载:27/0  |  提交时间:2022/12/07
Kernel  Computer architecture  Multicore processing  Deep learning  System-on-chip  Parallel processing  Real-time systems  Neural networks  parallel processing  real-time and embedded systems  single-chip multiprocessors  reinforcement learning  structured sparsity  
无权访问的条目 学位论文
作者:  孔阳阳
Adobe PDF(5559Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2018/07/10
无权访问的条目 学位论文
作者:  庞亮
Adobe PDF(5648Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2018/06/22
无权访问的条目 学位论文
作者:  范意兴
Adobe PDF(5240Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2018/06/22
无权访问的条目 学位论文
作者:  崔浩然
Adobe PDF(1562Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2018/06/22