Institute of Computing Technology, Chinese Academy IR
| 稠密向量实体检索模型的二值化提速压缩 | |
王苑铮; 范意兴 ; 陈薇; 张儒清; 郭嘉丰
| |
| 2023 | |
| 发表期刊 | 模式识别与人工智能
![]() |
| ISSN | 1003-6059 |
| 卷号 | 36期号:1页码:60 |
| 摘要 | 在实体检索任务中,为了从大规模实体库中高效筛选与查询相关的候选实体,可使用稠密向量检索模型.然而在现有的稠密向量检索模型中,由于实体向量维度较高,导致实时计算效率较低、存储空间较大.文中通过实验发现这些实体向量存在大量的冗余信息:一方面,绝大多数实体向量分布在互不相同的象限里;另一方面,语义相近的实体所在的象限也更近.因此,文中提出二值化的实体检索方法,用于压缩实体向量,加速相似度计算.具体而言,方法利用符号函数(sign),二值化压缩高维稠密的浮点向量,并通过汉明距离加快检索.从理论上分析文中方法保证检索性能的原因.通过定性、定量的分析实验验证理论的正确性,并给出基于随机升维旋转的二值检索性能改善方法. |
| 关键词 | Entity Retrieval Embedding Representation Dense Vector Retrieval Approximate Nearest Neighbor Retrieval Product Quantization 实体检索 嵌入式表示 稠密向量检索 近似近邻检索 乘积量化 |
| 语种 | 英语 |
| 文献类型 | 期刊论文 |
| 条目标识符 | http://119.78.100.204/handle/2XEOYT63/37907 |
| 专题 | 中国科学院计算技术研究所期刊论文_中文 |
| 作者单位 | 中国科学院计算技术研究所 |
| 第一作者单位 | 中国科学院计算技术研究所 |
| 推荐引用方式 GB/T 7714 | 王苑铮,范意兴,陈薇,等. 稠密向量实体检索模型的二值化提速压缩[J]. 模式识别与人工智能,2023,36(1):60. |
| APA | 王苑铮,范意兴,陈薇,张儒清,&郭嘉丰.(2023).稠密向量实体检索模型的二值化提速压缩.模式识别与人工智能,36(1),60. |
| MLA | 王苑铮,et al."稠密向量实体检索模型的二值化提速压缩".模式识别与人工智能 36.1(2023):60. |
| 条目包含的文件 | 条目无相关文件。 | |||||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [王苑铮]的文章 |
| [范意兴]的文章 |
| [陈薇]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [王苑铮]的文章 |
| [范意兴]的文章 |
| [陈薇]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [王苑铮]的文章 |
| [范意兴]的文章 |
| [陈薇]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论