Institute of Computing Technology, Chinese Academy IR
| SparkCRF:一种基于Spark的并行CRFs算法实现 | |
| 朱继召1; 贾岩涛2; 徐君2; 乔建忠1; 王元卓2; 程学旗2 | |
| 2016 | |
| 发表期刊 | 计算机研究与发展
![]() |
| ISSN | 1000-1239 |
| 卷号 | 53.0期号:008页码:1819 |
| 摘要 | 条件随机场(condition random fields,CRFs)可用于解决各种文本分析问题,如自然语言处理(natural language processing,NLP)中的序列标记、中文分词、命名实体识别、实体间关系抽取等.传统的运行在单节点上的条件随机场在处理大规模文本时,面临一系列挑战.一方面,个人计算机遇到处理的瓶颈从而难以胜任;另一方面,服务器执行效率较低.而通过升级服务器的硬件配置来提高其计算能力的方法,在处理大规模的文本分析任务时,终究不能从根本上解决问题.为此,采用"分而治之"的思想,基于Apache Spark的大数据处理框架设计并实现了运行在集群环境下的分布式CRFs——SparkCRF.实验表明,SparkCRF在文本分析任务中,具有高效的计算能力和较好的扩展性,并且具有与传统的单节点CRF++相同水平的准确率. |
| 关键词 | 大数据 机器学习 分布式计算 Spark 条件随机场 |
| 语种 | 英语 |
| 文献类型 | 期刊论文 |
| 条目标识符 | http://119.78.100.204/handle/2XEOYT63/36282 |
| 专题 | 中国科学院计算技术研究所期刊论文_中文 |
| 作者单位 | 1.东北大学 2.中国科学院计算技术研究所 |
| 推荐引用方式 GB/T 7714 | 朱继召,贾岩涛,徐君,等. SparkCRF:一种基于Spark的并行CRFs算法实现[J]. 计算机研究与发展,2016,53.0(008):1819. |
| APA | 朱继召,贾岩涛,徐君,乔建忠,王元卓,&程学旗.(2016).SparkCRF:一种基于Spark的并行CRFs算法实现.计算机研究与发展,53.0(008),1819. |
| MLA | 朱继召,et al."SparkCRF:一种基于Spark的并行CRFs算法实现".计算机研究与发展 53.0.008(2016):1819. |
| 条目包含的文件 | 条目无相关文件。 | |||||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [朱继召]的文章 |
| [贾岩涛]的文章 |
| [徐君]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [朱继召]的文章 |
| [贾岩涛]的文章 |
| [徐君]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [朱继召]的文章 |
| [贾岩涛]的文章 |
| [徐君]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论