Institute of Computing Technology, Chinese Academy IR
基于动态采样和迁移学习的疾病预测模型 | |
胡满满1; 陈旭1; 孙毓忠1; 沈曦1; 王晓青3; 余天洋4; 梅御东1; 肖立1; 程伟5; 杨杰6; 杨焱7 | |
2019 | |
发表期刊 | 计算机学报 |
ISSN | 0254-4164 |
卷号 | 42.0期号:010页码:2339 |
摘要 | 基于门诊病历临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.主流疾病预测模型将门诊病历转化为医学特征集合,将诊断结果作为输出标签,在此基础上利用机器学习算法训练疾病预测模型.不同疾病发病率的差异性导致医学样本具有不均衡、小样本特点,难以训练高效、准确的疾病预测模型.采样技术是目前解决样本不均衡问题的常用手段,其主要采用一定的策略生成均衡训练集,在均衡训练集上训练疾病预测模型,但是采样技术独立训练不同疾病的预测模型,没有考虑不同疾病模型之间的知识迁移性,限制了模型效果.迁移学习可以实现相似任务之间的知识迁移,如果将迁移学习运用到疾病预测模型训练过程中,在已有疾病诊断模型的基础上,训练新型疾病预测模型.受此启发,本文提出了基于动态采样和迁移学习的疾病预测模型,首先在多数类疾病上训练疾病预测模型,然后在此基础上训练少数类疾病预测模型,以实现不同疾病预测模型间的知识迁移.特别地,针对主流模型将疾病门诊病历转化为特征集合丢失文本信息的问题,本文提出了一种基于卷积神经网络的疾病预测模型,利用卷积神经网络提取语义信息;针对疾病模型知识迁移问题和小样本疾病训练问题,本文引入动态采样技术以构造均衡数据集,利用模型在不同样本上的预测结果来动态更新样本采样概率,目的是确保模型可以更多地关注错误分类样本和分类置信度不高的样本,从而提高预测模型的效果.本文在收集的门诊病历上进行了实验评估,实验结果表明,相对于目前主流疾病预测模型,本文提出的基于动态采样和迁移学习的疾病预测模型在准确率、召回率和F 1值上取得了重要的提升,尤其是召回率的提升具有十分重要的意义. |
关键词 | 疾病预测 迁移学习 动态采样 卷积神经网络 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/31045 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国科学院计算技术研究所 2.中国科学院研究生院 3.首都医科大学 4.南昌大学 5.中国中医科学院西苑医院 6.中国中医科学院 7.中国人民解放军联勤保障部队第九八三医院信息科 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 胡满满,陈旭,孙毓忠,等. 基于动态采样和迁移学习的疾病预测模型[J]. 计算机学报,2019,42.0(010):2339. |
APA | 胡满满.,陈旭.,孙毓忠.,沈曦.,王晓青.,...&杨焱.(2019).基于动态采样和迁移学习的疾病预测模型.计算机学报,42.0(010),2339. |
MLA | 胡满满,et al."基于动态采样和迁移学习的疾病预测模型".计算机学报 42.0.010(2019):2339. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[胡满满]的文章 |
[陈旭]的文章 |
[孙毓忠]的文章 |
百度学术 |
百度学术中相似的文章 |
[胡满满]的文章 |
[陈旭]的文章 |
[孙毓忠]的文章 |
必应学术 |
必应学术中相似的文章 |
[胡满满]的文章 |
[陈旭]的文章 |
[孙毓忠]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论