-
题名符号网络的局部标注特征与预测方法
被引量:4
- 1
-
-
作者
苏晓萍
宋玉蓉
-
机构
南京工业职业技术学院计算机与软件学院
南京邮电大学自动化学院
-
出处
《智能系统学报》
CSCD
北大核心
2018年第3期437-444,共8页
-
基金
国家自然科学基金项目(61672298
61373136)
+1 种基金
教育部人文社会科学研究规划基金项目(17YJAZH071)
江苏省高校优秀科技创新团队项目
-
文摘
当复杂网络的边具有正、负属性时称为符号网络。符号为正表示两用户间具有相互信任(朋友)关系,相反,符号为负表示不信任(敌对)关系。符号网络中的一个重要研究任务是给定部分观测的符号网络,预测未知符号。分析发现,具有弱结构平衡特征的符号网络,其邻接矩阵呈现全局低秩性,在该特征下链路符号预测问题可以近似表达为低秩矩阵分解问题。但基本低秩模型中,相邻节点间符号标注的局部行为特征未得到充分利用,论文提出了一种带偏置的低秩矩阵分解模型,将邻居节点的出边和入边符号特征作为偏置信息引入模型,以提高符号预测的精度。利用真实符号网络数据进行的实验证明,所提模型能够获得较其他基准算法好的预测效果且算法效率高。
-
关键词
符号网络
符号预测
低秩
矩阵分解
标注偏置
结构平衡理论
弱结构平衡理论
地位理论
-
Keywords
signed networks
sign prediction
low rank
matrix factorization
signed bias
structural balance theory
weak structural balance theory
status theory
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名中文常见医疗问题命名实体识别研究
- 2
-
-
作者
赵瑛
任燕春
王铁
许丹彤
-
机构
内蒙古科技大学信息工程学院
-
出处
《现代电子技术》
2022年第16期121-126,共6页
-
基金
国家自然科学基金项目(81460279)
国家自然科学基金项目(61841204)
+4 种基金
内蒙古自治区自然科学基金(2018LH08066)
内蒙古自治区自然科学基金(2015MS0604)
内蒙古自治区高等学校科学研究项目(NJZY145)
包头市科技计划项目(2015C2006⁃14
2017C1002)。
-
文摘
为了达到提高中文常见医疗问题命名实体识别的效果,并为医疗领域知识图谱及其知识搜索奠定基础的目的,文中借助BiLSTM⁃CRF模型在解决序列问题时的优越性和BERT模型的强大表义能力,将BERT集成到BiLSTM⁃CRF中组成BERT⁃BiLSTM⁃CRF模型。该模型通过引入BERT提取文本全局特征和局部特征,从而生成表义更加丰富的字向量,同时还具备BiLSTM网络捕获上下文语义信息和CRF标注偏置纠错的能力。鉴于目前缺少该领域的标注语料,该研究采用人工方式构建标注语料库。实验结果表明:BERT⁃BiLSTM⁃CRF模型的医疗实体识别效果优于传统的BiLSTM⁃CRF模型;且该模型在基于BIOE标注方案下实体识别效果较好,F1值达到97%;从类别上看,疾病类、症状类、检查类F1值达到99%,药物类达到92%。总体而言,中文常见医疗问题在基于BERT⁃BiLSTM⁃CRF模型并采用BIOE标注方案下实体识别效果最好,其中疾病类、症状类、检查类的实体识别效果较好。
-
关键词
中文常见医疗问题
命名实体识别
BERT⁃BiLSTM⁃CRF模型
特征提取
语义信息
标注偏置纠错
-
Keywords
Chinese common medical problem
named entity recognition
BERT⁃BiLSTM⁃CRF model
feature extraction
semantic information
annotation offset error correction
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP311
[电子电信—信息与通信工程]
-