期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
一种基于语义体系的同义词识别研究 被引量:13
1
作者 章成志 《淮阴工学院学报》 CAS 2004年第1期59-62,67,共5页
针对基于字面和词素相似度识别同义词的不足之处,首次引入《同义词词林》(以下简称《词林》),作为语义体系,提出了基于《词林》语义体系的同义词识别算法,并进行了词汇间的语义相似度度量,实现了同义词识别。实验结果表明,此方法在效率... 针对基于字面和词素相似度识别同义词的不足之处,首次引入《同义词词林》(以下简称《词林》),作为语义体系,提出了基于《词林》语义体系的同义词识别算法,并进行了词汇间的语义相似度度量,实现了同义词识别。实验结果表明,此方法在效率上远高于基于字面、词素相似度识别方法。 展开更多
关键词 同义词识别 《词林》 语义词典 相似度算法
下载PDF
共现关键词—叙词同义关系自动识别研究——基于互信息法、概率法的对比分析 被引量:8
2
作者 钟伟金 《图书情报工作》 CSSCI 北大核心 2012年第18期122-126,共5页
以科技文献中的共现关键词—叙词词对(以下简称共现词对)为研究对象,运用互信息法、概率法计算方法,以准确率和召回率为衡量指标,通过绝对值方式和相对最高值方式,分析这两种统计方法在不同区间内对同义共现词对的自动识别效果及特点。... 以科技文献中的共现关键词—叙词词对(以下简称共现词对)为研究对象,运用互信息法、概率法计算方法,以准确率和召回率为衡量指标,通过绝对值方式和相对最高值方式,分析这两种统计方法在不同区间内对同义共现词对的自动识别效果及特点。研究发现,概率法的相对最高值方式具有最佳的同义共现词对识别效果。最后,探讨互信息法、概率法与共现频率的关系,揭示这两种统计方法在同义共现词对的识别上存在互补的特性。 展开更多
关键词 同义词识别 互信息法 概率法 共现词
原文传递
一种信息检索系统的设计与实现 被引量:3
3
作者 尹积栋 刘红 +1 位作者 彭崧 张慧 《计算机与现代化》 2017年第5期123-126,共4页
提出一种信息检索系统的设计与实现方法。该系统基于"中文领域本体学习及半自动构建方法研究"项目,针对江西省教育厅科学技术研究项目"基于句法结构分析的中文聚类算法研究及应用"项目的实际需求而设计。本文主要... 提出一种信息检索系统的设计与实现方法。该系统基于"中文领域本体学习及半自动构建方法研究"项目,针对江西省教育厅科学技术研究项目"基于句法结构分析的中文聚类算法研究及应用"项目的实际需求而设计。本文主要介绍一种较客观、较综合地在网络上获取有价值的文本信息的系统设计与实现方法。 展开更多
关键词 信息检索 同义词识别 信息采集
下载PDF
基于知识库的网络信息概念挖掘(英文)
4
作者 章成志 侯汉清 《情报理论与实践》 CSSCI 北大核心 2004年第5期528-532,共5页
本文采用数据挖掘技术和情报语言学方法 ,构建了一个可以用于从因特网上提取信息、进行自动标引和自动分类的系统 ,提供了一种创建自动分类知识库的新方法 ;提出了一种用于主题抽取的位置加权算法 ,研制了一种改进汉语同义词识别性能的... 本文采用数据挖掘技术和情报语言学方法 ,构建了一个可以用于从因特网上提取信息、进行自动标引和自动分类的系统 ,提供了一种创建自动分类知识库的新方法 ;提出了一种用于主题抽取的位置加权算法 ,研制了一种改进汉语同义词识别性能的新方法 ,并在自动分类时运用了这种语义相似度识别算法。 展开更多
关键词 知识库 网络信息挖掘 概念挖掘 因特网 自动分类 自动标引 同义词识别
下载PDF
基于情报检索的汉语同义词识别初探 被引量:11
5
作者 刘华梅 侯汉清 《情报理论与实践》 CSSCI 北大核心 2005年第4期373-375,382,共4页
随着计算机的飞速发展,自然语言越来越广泛地应用于情报检索,同义词控制问题也成为情报学的研究热点。本文提出一种识别同义词的方法,这种方法基于检索网络搜索得到的统计数据,使用Dice测度方法测量两个词的相关度,相关度在给定的阈值... 随着计算机的飞速发展,自然语言越来越广泛地应用于情报检索,同义词控制问题也成为情报学的研究热点。本文提出一种识别同义词的方法,这种方法基于检索网络搜索得到的统计数据,使用Dice测度方法测量两个词的相关度,相关度在给定的阈值内就可以认为是同义词。通过分析测试结果,验证这种方法的可行性,并提出了这种方法的优缺点及其应用。 展开更多
关键词 情报检索 同义词 识别 汉语 自然语言 研究热点 控制问题 统计数据 网络搜索 测度方法 分析测试 相关度 计算机 情报学 可行性 优缺点 应用
下载PDF
基于层层深入的关键词-叙词同义关系自动识别研究 被引量:3
6
作者 钟伟金 《情报科学》 CSSCI 北大核心 2013年第4期84-88,共5页
本文以科技文献中共现关键词-叙词(下称"共现词对")为挖掘对象,首先,以字面相似法统计字面相似值,以最高相似值方式认定每个叙词同义对应的唯一关键词(起点词);然后使用概率法计算词对的共现强弱,并以叙词为单位按共现紧密度... 本文以科技文献中共现关键词-叙词(下称"共现词对")为挖掘对象,首先,以字面相似法统计字面相似值,以最高相似值方式认定每个叙词同义对应的唯一关键词(起点词);然后使用概率法计算词对的共现强弱,并以叙词为单位按共现紧密度由高到低排列,以起点词作为参考词,根据"同义相斥"、"相关相吸"的共现规律,按照一定的原则,逐个层层深入识别所有共现词对。实验结果表明,基于层层深入法的识别方式,是共现关键词-叙词同义关系识别的可靠、稳定的方法。 展开更多
关键词 同义词识别 共现关键词-叙词 字面相似 概率法
原文传递
方志物产挖掘及系统构建 被引量:1
7
作者 衡中青 侯汉清 《情报学报》 CSSCI 北大核心 2009年第2期175-181,共7页
本文首先根据方志文献的行文特征,设计一个统一规范的方志文献文档处理格式,用于文本文档的预处理。本文建立方志全文数据库,并基于数据库构建一个物产挖掘系统,进行物产信息挖掘,方法如下:通过抽取数据库正名字段内容识别物产正名,通... 本文首先根据方志文献的行文特征,设计一个统一规范的方志文献文档处理格式,用于文本文档的预处理。本文建立方志全文数据库,并基于数据库构建一个物产挖掘系统,进行物产信息挖掘,方法如下:通过抽取数据库正名字段内容识别物产正名,通过模式识别方法识别物产异名别称。最后建立包含物产正名和异名别称的物产标引词典,对全部物产文献进行标引,从而挖掘出物产名称。经测试,异名别称的识准率为71.6%,识全率为88.6%,表明系统是可行的。 展开更多
关键词 地方志 内容挖掘 模式识别 同义词识别
下载PDF
面向共指事件识别的同义表述模式抽取研究 被引量:1
8
作者 王君泽 宋小炯 杜洪涛 《情报学报》 CSSCI CSCD 北大核心 2020年第3期297-307,共11页
在共指消解领域,目前已经有大量研究工作围绕实体共指问题展开,而有关事件共指方面的研究则相对较少。由于事件表述的灵活性,共指事件识别的研究重点之一在于如何构建事件表述相似度的计算模型。而在对同一事件的相似表述中,不仅包含词... 在共指消解领域,目前已经有大量研究工作围绕实体共指问题展开,而有关事件共指方面的研究则相对较少。由于事件表述的灵活性,共指事件识别的研究重点之一在于如何构建事件表述相似度的计算模型。而在对同一事件的相似表述中,不仅包含词级别的同义表述,还包含语句级别的同义表述。针对该状况,本文基于新闻报道语料的特点,一方面针对词级别同义表述模式的抽取,设计了同义词知识库的自动构建策略,并考虑了缩略语、同位语等情况的处理;另一方面在词级别同义表述模式抽取的基础上,设计了语句级别同义表述实例的识别策略,进而可以抽取同义表述模式并剔除模式中的冗余成分。通过在实际数据集合上的实验,表明了本文策略的有效性。基于抽取到的词级别和语句级别的同义表述模式,可以有效提升共指事件识别的效果;本文工作也可以视为对共指事件识别现有策略的有益补充。 展开更多
关键词 事件共指 共指消解 同义词识别 同义表述模式
下载PDF
基于查询日志分析的中文网页关键词抽取方法 被引量:1
9
作者 王晓艳 王珍珍 《广西师范大学学报(自然科学版)》 CAS 北大核心 2015年第2期42-48,共7页
以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断,提出了单位篇幅停留时间... 以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断,提出了单位篇幅停留时间、逆向点击率、排名补偿因子3个指标,并对其进行综合加权。在查询串分词、同义词识别及多义词消歧、关键短语组配方面,也做了特殊处理。实验结果表明:抽取关键词的准确率较高,综合性能也高于TF.IDF和SVM方法。该方法能得到较满意的关键词抽取效果。 展开更多
关键词 查询日志 关键词抽取 关键短语组配 同义词识别 多义词消歧
下载PDF
利用D-S证据理论进行特征融合的同义实体识别 被引量:6
10
作者 何晶晶 蔡德胜 +1 位作者 介飞 吴共庆 《计算机应用研究》 CSCD 北大核心 2018年第5期1429-1433,共5页
针对现实中同一实体存在不同表象的问题,提出一种基于D-S证据理论特征融合的同义实体识别方法。以搜索引擎为外部知识库获取实体特征信息,利用相似函数计算特征值,由D-S证据理论融合一组特征值,经阈值判断完成同义实体的识别。特征融合... 针对现实中同一实体存在不同表象的问题,提出一种基于D-S证据理论特征融合的同义实体识别方法。以搜索引擎为外部知识库获取实体特征信息,利用相似函数计算特征值,由D-S证据理论融合一组特征值,经阈值判断完成同义实体的识别。特征融合识别算法在医疗机构数据集上的识别精度、召回率和F值分别达到了85.80%、81.18%、83.43%,比单纯利用实体名的算法分别提高了4.09%、4.30%和4.21%。实验表明D-S证据理论将多特征融合,对同义实体识别具有更好的识别效果。 展开更多
关键词 D-S证据理论 特征融合 同义实体识别 搜索引擎 相似函数
下载PDF
基于同义实体识别的Web信息集成 被引量:3
11
作者 徐喆昊 吴共庆 胡学钢 《计算机系统应用》 2015年第9期35-42,共8页
准确有效地集成海量Web信息,是Web信息动态聚合、市场情报分析、舆情分析、商业智能等分析型应用的重要基础.针对数据集成过程中不同实体指代同一实体的问题,利用搜索引擎返回的页面摘要信息,设计并实现了一种基于搜索引擎的同义实体识... 准确有效地集成海量Web信息,是Web信息动态聚合、市场情报分析、舆情分析、商业智能等分析型应用的重要基础.针对数据集成过程中不同实体指代同一实体的问题,利用搜索引擎返回的页面摘要信息,设计并实现了一种基于搜索引擎的同义实体识别算法FSE,并提出了一种基于同义实体识别的Web信息集成框架.在医院信息集成测试数据集上的实验结果表明,FSE算法效果优于基于Varient Dice、Varient Cosine、Varient Jaccard、Varient Overlap相似度计算的同义实体识别算法. 展开更多
关键词 WEB信息集成 同义实体识别 相似度计算 搜索引擎
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部