摘要
针对医疗文本中主流搜索方法大多采用关键字抽取的方法进行问题的搜索效果不足以满足需求。论文提出使用基于深度学习的语言概率模型构建文本向量空间,通过计算统计词语在文本数据中上下文背景的出现概率,将文本信息由字符串转化为向量化数据进行语义相似度计算,使用神经网络深度学习框架进行搜索方法的算法优化实现。实验显示,该方法测试结果在精度指标上取得了高于文档数据集精度基准线值的表现,对比原有方法存在20%的提升。
Most of the mainstream search methods in medical text use keyword extraction,and the search effect is not enough to meet the needs.In this paper,a language probability model based on deep learning is proposed to construct the text vector space.By calculating the occurrence probability of the statistical words in the context of the text data,the text information is transformed from the string into the vector data for semantic similarity calculation,and the neural network deep learning framework is used to optimize the algorithm of the search method.The experimental results show that the accuracy index of this method is higher than the benchmark value of document data set,and there is a 20%improvement compared with the original method.
作者
黄承宁
李双梅
景波
HUANG Chengning;LI Shuangmei;JING Bo(Nanjing Tech University Pujiang Institute,Nanjing 211222;Nanjing Audit University,Nanjing 211812)
出处
《计算机与数字工程》
2022年第6期1149-1152,共4页
Computer & Digital Engineering
基金
国家自然科学基金项目(编号:61702229)
江苏省高等学校自然科学研究项目(编号:18KJD520001)
南京工业大学浦江学院人才培养工程计划项目(编号:njpji2019-2-01)资助。
关键词
深度学习
语义相似度
神经网络
语言概率模型
deep learning
semantic similarity
neural network
probabilistic language modeling