Institute of Computing Technology, Chinese Academy IR
一种基于时间序列预测的重采策略 | |
史存会; 孟剑; 俞晓明; 刘悦; 靳小龙; 程学旗 | |
2019 | |
发表期刊 | 中文信息学报 |
ISSN | 1003-0077 |
卷号 | 000期号:007页码:101 |
摘要 | 及时获取新增内容,是采集器的重要衡量指标。基于版块页-内容页架构设计的网络采集器通过定期重采入口的版块页,能够有效地快速识别新产生内容页面并进行扩展。然而获取内容的实时性与对网站访问的友好性存在一定的折中。传统的重采策略关注时效性,而忽略了对网站访问的友好性。该文提出了一种基于时间序列预测的改进重采策略兼顾时效性和友好性。实验表明,该方法可以在保证数据采集实时性的情况下,有效降低访问量,提升对网站访问的友好性。 |
关键词 | 网络采集 采集策略 时间序列预测 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/26205 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国科学院计算技术研究所 2.中国科学院 |
推荐引用方式 GB/T 7714 | 史存会,孟剑,俞晓明,等. 一种基于时间序列预测的重采策略[J]. 中文信息学报,2019,000(007):101. |
APA | 史存会,孟剑,俞晓明,刘悦,靳小龙,&程学旗.(2019).一种基于时间序列预测的重采策略.中文信息学报,000(007),101. |
MLA | 史存会,et al."一种基于时间序列预测的重采策略".中文信息学报 000.007(2019):101. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[史存会]的文章 |
[孟剑]的文章 |
[俞晓明]的文章 |
百度学术 |
百度学术中相似的文章 |
[史存会]的文章 |
[孟剑]的文章 |
[俞晓明]的文章 |
必应学术 |
必应学术中相似的文章 |
[史存会]的文章 |
[孟剑]的文章 |
[俞晓明]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论