期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
命名实体识别研究综述 被引量:141
1
作者 刘浏 王东波 《情报学报》 CSSCI CSCD 北大核心 2018年第3期329-340,共12页
命名实体识别一直以来都是信息抽取、自然语言处理等领域中重要的研究任务,随着机器学习技术的新发展,数字人文研究的兴起,事件知识和实体知识变得越发重要,命名实体识别焕发出新的发展动力。本文详细梳理了命名实体识别从提出至今的发... 命名实体识别一直以来都是信息抽取、自然语言处理等领域中重要的研究任务,随着机器学习技术的新发展,数字人文研究的兴起,事件知识和实体知识变得越发重要,命名实体识别焕发出新的发展动力。本文详细梳理了命名实体识别从提出至今的发展脉络,从实体的定义、重要的评测会议、主流的研究方法研究的应用价值等角度,全面考察了该领域的研究现状,并分析了命名实体识别未来的发展趋势。 展开更多
关键词 命名实体识别 实体挖掘 信息抽取
下载PDF
融合多策略的中文科技文献机构名称规范化研究与实践 被引量:1
2
作者 刘燕 孙月萍 侯丽 《医学信息学杂志》 CAS 2022年第12期32-38,共7页
分析中文科技文献中机构著录项的组织特点和中文机构名称的命名特点,详细阐述常见机构名称规范化方法、中文科技文献机构名称规范化处理流程,提出利用字符串匹配词典和规则过滤等方法提取规范化的机构名称,并基于机构-作者共现关系,计... 分析中文科技文献中机构著录项的组织特点和中文机构名称的命名特点,详细阐述常见机构名称规范化方法、中文科技文献机构名称规范化处理流程,提出利用字符串匹配词典和规则过滤等方法提取规范化的机构名称,并基于机构-作者共现关系,计算作者共现率,结合绝对共现量和共现率阈值实现机构实体的消歧,能够有效匹配同一机构的不同表现形式。 展开更多
关键词 机构名称规范 科技文献 作者共现 实体挖掘
下载PDF
基于半监督话题模型的用户查询日志命名实体挖掘 被引量:6
3
作者 曹雷 郭嘉丰 +1 位作者 白露 程学旗 《中文信息学报》 CSCD 北大核心 2012年第5期26-32,共7页
基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体... 基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体具有歧义性、查询模板具有多义性和未标注实体信息,因而不能够有效的对候选实体进行排序。该文采用半监督话题模型,利用查询模板之间的关系来学习实体类别的模板分布,进而改善候选实体的排序效果。实验结果表明了该文提出方法的有效性。 展开更多
关键词 用户查询日志 命名实体挖掘 半监督话题模型
下载PDF
基于转移学习的命名实体挖掘技术 被引量:3
4
作者 翟海军 郭勇 +1 位作者 郭嘉丰 程学旗 《上海交通大学学报》 EI CAS CSCD 北大核心 2011年第2期164-167,共4页
研究了针对大规模查询日志中丰富的命名实体的挖掘技术,通过利用Wikipedia数据,结合转移学习方法构建目标类别的分类器.该技术很好地利用了监督学习的优越性能以提高查询日志中命名实体挖掘的准确性,同时也解决了监督学习方法中大规模... 研究了针对大规模查询日志中丰富的命名实体的挖掘技术,通过利用Wikipedia数据,结合转移学习方法构建目标类别的分类器.该技术很好地利用了监督学习的优越性能以提高查询日志中命名实体挖掘的准确性,同时也解决了监督学习方法中大规模标注的问题.实验结果表明,基于转移学习的命名实体挖掘技术具有优越的命名实体挖掘性能. 展开更多
关键词 转移学习 命名实体挖掘 正例学习
下载PDF
基于二部图半监督方法的查询日志实体挖掘 被引量:2
5
作者 曹雷 郭嘉丰 程学旗 《山东大学学报(理学版)》 CAS CSCD 北大核心 2012年第5期32-37,42,共7页
基于用户查询日志的命名实体挖掘的目标是从用户查询日志中挖掘一组具有指定类别的命名实体。为解决已有用户查询日志实体挖掘研究工作中的种子实体不充分的问题,提出了一种基于二部图的半监督排序方法,利用实体之间的关系(实体共享查... 基于用户查询日志的命名实体挖掘的目标是从用户查询日志中挖掘一组具有指定类别的命名实体。为解决已有用户查询日志实体挖掘研究工作中的种子实体不充分的问题,提出了一种基于二部图的半监督排序方法,利用实体之间的关系(实体共享查询模板)来改善实体排序效果。该方法首先基于候选实体和查询模板构建一个二部图,然后基于二部图将种子实体的类别相关性传播到其他候选实体,最后按照类别相关性得分对候选实体进行排序,并进一步给出方法中迭代过程的等价优化框架。实验结果表明本文提出的方法优于基准方法,具有较好的挖掘效果。 展开更多
关键词 用户查询日志 命名实体挖掘 半监督方法 二部图
原文传递
一种结构化数据关系特征抽取和表示模型 被引量:9
6
作者 洪立印 徐蔚然 《软件》 2013年第12期148-151,共4页
WAF(词激活力)是一种基于统计的描述词与词关系的算法,WAF不单纯是考虑的词之间的关联,还考虑了词前后顺序,词与词之间的距离,包含了概率和语言规则两种信息量。本文提出一种实体结构化数据的关系特征抽取算法,并基于该特征实现实体聚... WAF(词激活力)是一种基于统计的描述词与词关系的算法,WAF不单纯是考虑的词之间的关联,还考虑了词前后顺序,词与词之间的距离,包含了概率和语言规则两种信息量。本文提出一种实体结构化数据的关系特征抽取算法,并基于该特征实现实体聚类。首先提取出实体结构化数据的语义和语境特征,以此来文本建模,然后对每个属性基于WAF值进行相似度计算,最后进行实体聚类。 展开更多
关键词 自然语言处理 实体特征抽取 实体关系挖掘
下载PDF
异构信息空间中实体关联关系挖掘算法CFRQ4A 被引量:7
7
作者 杨丹 申德荣 +2 位作者 聂铁铮 于戈 寇月 《计算机研究与发展》 EI CSCD 北大核心 2014年第4期895-904,共10页
丰富的实体关联关系是在异构信息空间中进行数据分析、数据挖掘、知识发现和语义查询等许多应用的前提条件和关键所在.然而不同于同构信息网络,由于异构信息空间中实体关联关系的复杂性、多样性和异构性使得实体关联关系挖掘并不是一件... 丰富的实体关联关系是在异构信息空间中进行数据分析、数据挖掘、知识发现和语义查询等许多应用的前提条件和关键所在.然而不同于同构信息网络,由于异构信息空间中实体关联关系的复杂性、多样性和异构性使得实体关联关系挖掘并不是一件简单的任务,更具有挑战性.以作者文献网络为例,提出了一个通用的,由聚类、过滤、推理和量化4步骤组成的异构信息空间中基于聚类的实体关联关系挖掘算法CFRQ4A(clustering,filtering,reasoning and qualifying for associations).CFRQ4A算法不仅利用了异构实体自身的属性值,还利用了异构信息网络的结构(路径)信息;在挖掘过程中引入关联关系约束来保证关联关系的语义和逻辑正确性,并且针对实体关联关系的特点提出了关联强度量化模型.在真实数据集DBLP上的实验结果表明所提出算法是可行和有效的. 展开更多
关键词 异构信息空间 实体关联关系挖掘 作者文献网络 结构信息 关联关系约束
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部