CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
SparkCRF:一种基于Spark的并行CRFs算法实现
朱继召1; 贾岩涛2; 徐君2; 乔建忠1; 王元卓2; 程学旗2
2016
发表期刊计算机研究与发展
ISSN1000-1239
卷号53.0期号:008页码:1819
摘要条件随机场(condition random fields,CRFs)可用于解决各种文本分析问题,如自然语言处理(natural language processing,NLP)中的序列标记、中文分词、命名实体识别、实体间关系抽取等.传统的运行在单节点上的条件随机场在处理大规模文本时,面临一系列挑战.一方面,个人计算机遇到处理的瓶颈从而难以胜任;另一方面,服务器执行效率较低.而通过升级服务器的硬件配置来提高其计算能力的方法,在处理大规模的文本分析任务时,终究不能从根本上解决问题.为此,采用"分而治之"的思想,基于Apache Spark的大数据处理框架设计并实现了运行在集群环境下的分布式CRFs——SparkCRF.实验表明,SparkCRF在文本分析任务中,具有高效的计算能力和较好的扩展性,并且具有与传统的单节点CRF++相同水平的准确率.
关键词大数据 机器学习 分布式计算 Spark 条件随机场
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/36282
专题中国科学院计算技术研究所期刊论文_中文
作者单位1.东北大学
2.中国科学院计算技术研究所
推荐引用方式
GB/T 7714
朱继召,贾岩涛,徐君,等. SparkCRF:一种基于Spark的并行CRFs算法实现[J]. 计算机研究与发展,2016,53.0(008):1819.
APA 朱继召,贾岩涛,徐君,乔建忠,王元卓,&程学旗.(2016).SparkCRF:一种基于Spark的并行CRFs算法实现.计算机研究与发展,53.0(008),1819.
MLA 朱继召,et al."SparkCRF:一种基于Spark的并行CRFs算法实现".计算机研究与发展 53.0.008(2016):1819.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[朱继召]的文章
[贾岩涛]的文章
[徐君]的文章
百度学术
百度学术中相似的文章
[朱继召]的文章
[贾岩涛]的文章
[徐君]的文章
必应学术
必应学术中相似的文章
[朱继召]的文章
[贾岩涛]的文章
[徐君]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。