-
题名面向中文医疗问答网站的相似问题检索研究
被引量:1
- 1
-
-
作者
王保成
刘利军
黄青松
-
机构
昆明理工大学信息工程与自动化学院
云南省计算机技术应用重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2022年第6期135-145,共11页
-
基金
国家自然科学基金(81860318,81560296)。
-
文摘
医疗问答平台主要通过关键词检索来服务,但其缺点是难以应对文本中多样化表达、否定词较多等特点,且不能充分根据用户的语义查询,使查询结果中有大量无关项。因此该文先用基于改进文本卷积神经网络的哈希生成模型,进行相似问题的语义检出,以更好地处理文本中的多样化表达、否定词较多等现象。然后,用更精确的文本匹配模型对检出集合进行过滤和排序,通过集成学习构建该模型。模型先集成Siamese-BERT模型,该模型利用孪生网络,并用BERT作为基础模型,能更好地进行语义抽取;接着集成BERT-Match模型,该模型借助BERT的多头注意力机制,能更好地捕捉问句间的局部相关性。最后,用梯度下降提升树将语义特征及统计特征结合,使模型更准确。实验结果表明,该文方法在进行相似问题检出和文本匹配时能得到更好的结果。
-
关键词
医疗问答平台
文本卷积神经网络
文本匹配模型
集成学习
-
Keywords
medical question and answer platform
text convolutional neural network
text matching model
integrated learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-