CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
面向异构IoT设备协作的DNN推断加速研究
孙胜1; 李叙晶1; 刘敏1; 杨博1; 过晓冰3
2020
发表期刊计算机研究与发展
ISSN1000-1239
卷号57.0期号:004页码:709
摘要深度神经网络(deep neural network,DNN)已经广泛应用于各种智能应用,如图像和视频识别.然而,由于DNN任务计算量大,资源受限的物联网(Internet of things,IoT)设备难以本地单独执行DNN推断任务.现有云协助方法容易受到通信延迟无法预测和远程服务器性能不稳定等因素的影响.一种非常有前景的方法是利用IoT设备协作实现分布式、可扩展DNN任务推断.然而,现有工作仅研究IoT设备同构情况下的静态拆分策略.因此,迫切需要研究如何在能力异构且资源受限的IoT设备间自适应地拆分DNN任务,协作执行任务推断.上述研究问题面临2个重要挑战:1)DNN任务多层推断延迟难以准确预测;2)难以在异构动态的多设备环境中实时智能调整协作推断策略.为此,首先提出细粒度可解释的多层延迟预测模型.进一步,利用进化增强学习(evolutionary reinforcement learning,ERL)自适应确定DNN推断任务的近似最优拆分策略.实验结果表明:该方法能够在异构动态环境中实现显著DNN推断加速.
关键词深度神经网络推断加速 异构设备协作 进化增强学习 多层预测模型 拆分策略
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/31921
专题中国科学院计算技术研究所期刊论文_中文
作者单位1.中国科学院计算技术研究所
2.中国科学院大学
3.联想研究院
第一作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
孙胜,李叙晶,刘敏,等. 面向异构IoT设备协作的DNN推断加速研究[J]. 计算机研究与发展,2020,57.0(004):709.
APA 孙胜,李叙晶,刘敏,杨博,&过晓冰.(2020).面向异构IoT设备协作的DNN推断加速研究.计算机研究与发展,57.0(004),709.
MLA 孙胜,et al."面向异构IoT设备协作的DNN推断加速研究".计算机研究与发展 57.0.004(2020):709.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[孙胜]的文章
[李叙晶]的文章
[刘敏]的文章
百度学术
百度学术中相似的文章
[孙胜]的文章
[李叙晶]的文章
[刘敏]的文章
必应学术
必应学术中相似的文章
[孙胜]的文章
[李叙晶]的文章
[刘敏]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。