期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于ERNIE序列标注的地址分级模型应用 被引量:1
1
作者 刘贤松 屠梓浩 高有利 《邮电设计技术》 2023年第2期89-92,共4页
提出基于ERNIE序列标注的地址分级模型进行地址提取识别,将地址分级问题转换为一个序列标注的NLP问题。首先将原始待分级地址文本输入到训练好的ERNIE命名实体识别算法训练模型中,得到11级地址的粗略分级;然后应用AC自动机算法,对地址的... 提出基于ERNIE序列标注的地址分级模型进行地址提取识别,将地址分级问题转换为一个序列标注的NLP问题。首先将原始待分级地址文本输入到训练好的ERNIE命名实体识别算法训练模型中,得到11级地址的粗略分级;然后应用AC自动机算法,对地址的前5级地址进行补全或纠正,再通过正则化匹配对地址后4级进行纠正。提出的模型不仅可以提高地址解析的准确率,还可以对错误地址进行纠正,最后将模型用于真实数据集,验证了方法的有效性。 展开更多
关键词 地址分级 地址提取 序列标注 ERNIE算法
下载PDF
基于膨胀卷积的中文命名实体识别
2
作者 张东 迟呈英 战学刚 《辽宁科技大学学报》 CAS 2020年第3期231-236,共6页
基于循环神经网络模型在命名实体识别任务中限制了GPU并行计算效率,提出融合全局词频统计的膨胀卷积模型。对训练语料文本向量化后,使用文本向量训练膨胀卷积神经网络各节点权重,通过条件随机场有效避免预测结果产生不符合规则标签。在M... 基于循环神经网络模型在命名实体识别任务中限制了GPU并行计算效率,提出融合全局词频统计的膨胀卷积模型。对训练语料文本向量化后,使用文本向量训练膨胀卷积神经网络各节点权重,通过条件随机场有效避免预测结果产生不符合规则标签。在MSRA数据集上,F1值达到了92.12%,在简历数据集上,F1值达到了93.48%。模型的训练速度相比Bi-LSTM-CRF模型提高了3倍。条件随机场虽然能够学习到标签之间的潜在关系,但极大地降低了模型的运行速度。同时在序列建模中,卷积神经网络无法考虑词的有序关系。实验结果表明,本文的模型可在保持高精度的同时,具有更快的处理速度。 展开更多
关键词 命名实体识别 膨胀卷积 序列标注
下载PDF
Fine-Grained Opinion Extraction from Chinese Car Reviews with an Integrated Strategy
3
作者 WANG Yinglin WANG Ming 《Journal of Shanghai Jiaotong university(Science)》 EI 2018年第5期620-626,共7页
With rapid development of E-commerce, a large amount of data including reviews about different types of products can be accessed within short time. On top of this, opinion mining is becoming increasingly effective to ... With rapid development of E-commerce, a large amount of data including reviews about different types of products can be accessed within short time. On top of this, opinion mining is becoming increasingly effective to extract valuable information for product design, improvement and brand marketing, especially with fine-grained opinion mining. However, limited by the unstructured and causal expression of opinions, one cannot extract valuable information conveniently. In this paper, we propose an integrated strategy to automatically extract feature-based information, with which one can easily acquire detailed opinion about certain products.For adaptation to the reviews' characteristics, our strategy is made up of a multi-label classification(MLC) for reviews, a binary classification(BC) for sentences and a sentence-level sequence labelling with a deep learning method. During experiment, our approach achieves 82% accuracy in the final sequence labelling task under the setting of a 20-fold cross validation. In addition, the strategy can be expediently employed in other reviews as long as there is an according amount of labelled data for startup. 展开更多
关键词 opinion extraction multi-label classification (MLC) binary classification (BC) sequence labelling recurrent neural network (RNN)
原文传递
静脉用药集中调配输液顺序智能提醒调控方法探讨 被引量:13
4
作者 邱季 邓婷婷 +3 位作者 陈晨 刘婷 刘云洁 戴夫 《中华医院管理杂志》 CSCD 北大核心 2018年第8期674-676,共3页
设计并建立了8个涉及合理用药的药学信息子数据库,包括“给药频次”“先治疗药物后辅助用药”“调配后储存时限…‘连续输注两种输液在输液管内配伍禁忌…‘时辰药理学”“顺序依赖性药物相互作用”“具有刺激性不良反应的药物”及“... 设计并建立了8个涉及合理用药的药学信息子数据库,包括“给药频次”“先治疗药物后辅助用药”“调配后储存时限…‘连续输注两种输液在输液管内配伍禁忌…‘时辰药理学”“顺序依赖性药物相互作用”“具有刺激性不良反应的药物”及“预防用药”。执行至静脉用药调配中心(PIVAS)的静脉用药长期医嘱涉及其中任一子数据库的内容时,从“先治疗药物后辅助用药”开始,系统依次以“辅助”“时限”“禁忌”“时辰”“相互”“刺激”及“预防(治疗)”提示。药师根据提示进行合理排序,并将输注顺序标注于成品输液标签上。与智能提醒前相比较,智能提醒后标注输液顺序的病区由2个增至43个;标注输液顺序患者占总住院患者百分比由0.50%升至66.33%;标注输液顺序的医嘱占总医嘱百分比由0.72%增至78.94%;相同工作量药师花费时间由73.44h/d减少到1.94h/d;冲管次数由34.42次/(病区·天)减少到1.49次/(病区·天),用于冲管输液费用由151.26万元/年降至6.54万元/年。PIVAS通过智能提醒建立了基于提高用药安全性和有效性的输液顺序调控方法。 展开更多
关键词 输注 静脉内 静脉用药调配中心 智能提醒 输液顺序 标签标注
原文传递
基于最大熵模型的学术缩写自动识别 被引量:1
5
作者 张秋子 陆伟 +1 位作者 程齐凯 黄永 《情报工程》 2015年第2期64-72,共9页
为实现海量英文学术文本中缩写词及对应缩写定义的识别,本文提出了一种自动缩写识别算法MELearn-AI。该算法在人工标注数据集的基础上,从序列标注的角度,通过最大熵模型实现了计算机领域英文学术文本中的自动缩写识别。MELearn-AI在本... 为实现海量英文学术文本中缩写词及对应缩写定义的识别,本文提出了一种自动缩写识别算法MELearn-AI。该算法在人工标注数据集的基础上,从序列标注的角度,通过最大熵模型实现了计算机领域英文学术文本中的自动缩写识别。MELearn-AI在本文构建的评测数据集"Paren-sen"上得到了95.8%的查准率和86.3%的查全率,相对于其他两组对照实验的效果有较为明显的提升。本文提出的自动缩写识别方法能够在计算机领域的学术文本上取得令人满意的效果,有助于更好地理解并利用该领域术语。 展开更多
关键词 学术文本 缩写 机器学习 序列标注 信息抽取
下载PDF
人淋巴毒素基因的分子克隆及其物理图谱
6
作者 李凌衡 庄文漪 +2 位作者 柴建华 李昌本 赵寿元 《生物工程学报》 CAS CSCD 北大核心 1990年第1期24-31,共8页
本文报道用一种简便、快速并省时的方法——体内同源重组法,以小鼠淋巴毒素(MuLT)cDNA为探针,从以粘粒pcos2EMBL为载体构建成的人基因组文库中分离出人淋巴毒素(HuLT)基因。然后,以同位素^(32)P标记重组粘粒的cos单链末端,再将经限制酶... 本文报道用一种简便、快速并省时的方法——体内同源重组法,以小鼠淋巴毒素(MuLT)cDNA为探针,从以粘粒pcos2EMBL为载体构建成的人基因组文库中分离出人淋巴毒素(HuLT)基因。然后,以同位素^(32)P标记重组粘粒的cos单链末端,再将经限制酶部份酶切的这种重组粘粒DNA片段电泳分部后,制作出HuLT基因的EcoR Ⅰ、BamH Ⅰ、Pst Ⅰ和Pvu Ⅱ四种限制性内切酶的物理图谱。 展开更多
关键词 淋巴毒素基因 分子克隆 基因物理图
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部