期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于层层深入的关键词-叙词同义关系自动识别研究 被引量:3
1
作者 钟伟金 《情报科学》 CSSCI 北大核心 2013年第4期84-88,共5页
本文以科技文献中共现关键词-叙词(下称"共现词对")为挖掘对象,首先,以字面相似法统计字面相似值,以最高相似值方式认定每个叙词同义对应的唯一关键词(起点词);然后使用概率法计算词对的共现强弱,并以叙词为单位按共现紧密度... 本文以科技文献中共现关键词-叙词(下称"共现词对")为挖掘对象,首先,以字面相似法统计字面相似值,以最高相似值方式认定每个叙词同义对应的唯一关键词(起点词);然后使用概率法计算词对的共现强弱,并以叙词为单位按共现紧密度由高到低排列,以起点词作为参考词,根据"同义相斥"、"相关相吸"的共现规律,按照一定的原则,逐个层层深入识别所有共现词对。实验结果表明,基于层层深入法的识别方式,是共现关键词-叙词同义关系识别的可靠、稳定的方法。 展开更多
关键词 同义词识别 共现关键词-叙词 字面相似 概率法
原文传递
一种基于语义体系的同义词识别研究 被引量:13
2
作者 章成志 《淮阴工学院学报》 CAS 2004年第1期59-62,67,共5页
针对基于字面和词素相似度识别同义词的不足之处,首次引入《同义词词林》(以下简称《词林》),作为语义体系,提出了基于《词林》语义体系的同义词识别算法,并进行了词汇间的语义相似度度量,实现了同义词识别。实验结果表明,此方法在效率... 针对基于字面和词素相似度识别同义词的不足之处,首次引入《同义词词林》(以下简称《词林》),作为语义体系,提出了基于《词林》语义体系的同义词识别算法,并进行了词汇间的语义相似度度量,实现了同义词识别。实验结果表明,此方法在效率上远高于基于字面、词素相似度识别方法。 展开更多
关键词 同义词识别 《词林》 语义词典 相似度算法
下载PDF
共现关键词—叙词同义关系自动识别研究——基于互信息法、概率法的对比分析 被引量:8
3
作者 钟伟金 《图书情报工作》 CSSCI 北大核心 2012年第18期122-126,共5页
以科技文献中的共现关键词—叙词词对(以下简称共现词对)为研究对象,运用互信息法、概率法计算方法,以准确率和召回率为衡量指标,通过绝对值方式和相对最高值方式,分析这两种统计方法在不同区间内对同义共现词对的自动识别效果及特点。... 以科技文献中的共现关键词—叙词词对(以下简称共现词对)为研究对象,运用互信息法、概率法计算方法,以准确率和召回率为衡量指标,通过绝对值方式和相对最高值方式,分析这两种统计方法在不同区间内对同义共现词对的自动识别效果及特点。研究发现,概率法的相对最高值方式具有最佳的同义共现词对识别效果。最后,探讨互信息法、概率法与共现频率的关系,揭示这两种统计方法在同义共现词对的识别上存在互补的特性。 展开更多
关键词 同义词识别 互信息法 概率法 共现词
原文传递
一种信息检索系统的设计与实现 被引量:3
4
作者 尹积栋 刘红 +1 位作者 彭崧 张慧 《计算机与现代化》 2017年第5期123-126,共4页
提出一种信息检索系统的设计与实现方法。该系统基于"中文领域本体学习及半自动构建方法研究"项目,针对江西省教育厅科学技术研究项目"基于句法结构分析的中文聚类算法研究及应用"项目的实际需求而设计。本文主要... 提出一种信息检索系统的设计与实现方法。该系统基于"中文领域本体学习及半自动构建方法研究"项目,针对江西省教育厅科学技术研究项目"基于句法结构分析的中文聚类算法研究及应用"项目的实际需求而设计。本文主要介绍一种较客观、较综合地在网络上获取有价值的文本信息的系统设计与实现方法。 展开更多
关键词 信息检索 同义词识别 信息采集
下载PDF
方志物产挖掘及系统构建 被引量:1
5
作者 衡中青 侯汉清 《情报学报》 CSSCI 北大核心 2009年第2期175-181,共7页
本文首先根据方志文献的行文特征,设计一个统一规范的方志文献文档处理格式,用于文本文档的预处理。本文建立方志全文数据库,并基于数据库构建一个物产挖掘系统,进行物产信息挖掘,方法如下:通过抽取数据库正名字段内容识别物产正名,通... 本文首先根据方志文献的行文特征,设计一个统一规范的方志文献文档处理格式,用于文本文档的预处理。本文建立方志全文数据库,并基于数据库构建一个物产挖掘系统,进行物产信息挖掘,方法如下:通过抽取数据库正名字段内容识别物产正名,通过模式识别方法识别物产异名别称。最后建立包含物产正名和异名别称的物产标引词典,对全部物产文献进行标引,从而挖掘出物产名称。经测试,异名别称的识准率为71.6%,识全率为88.6%,表明系统是可行的。 展开更多
关键词 地方志 内容挖掘 模式识别 同义词识别
下载PDF
结合链接结构和共现分析的同义词自动识别方法 被引量:2
6
作者 黄芳 刘友华 +1 位作者 张克状 李寅 《现代情报》 2009年第8期125-127,共3页
同义词自动识别在信息检索、知识挖掘等方面起着重要作用,一直以来都是业界的关注焦点。本文结合网上词典链接分析方法和共现分析方法来自动提取同义词,分别通过分析页面的后向链接信息、重定向页面和对网页内容利用共现分析方法来识别... 同义词自动识别在信息检索、知识挖掘等方面起着重要作用,一直以来都是业界的关注焦点。本文结合网上词典链接分析方法和共现分析方法来自动提取同义词,分别通过分析页面的后向链接信息、重定向页面和对网页内容利用共现分析方法来识别同义词,和传统的同义词识别方法比较有更好的覆盖率和准确性。 展开更多
关键词 同义词识别 链接挖掘 共现分析 相似度
下载PDF
基于电子商务用户行为的同义词识别 被引量:2
7
作者 张书娟 董喜双 关毅 《中文信息学报》 CSCD 北大核心 2012年第3期79-85,共7页
该文研究了电子商务领域同义词的自动识别问题。电子商务领域的同义词是指对同一事物或概念的不同表达,即在商品描述和检索中可以相互替换的词,针对该领域新词多、错别字多、近义词多的特点,提出基于用户行为的同义词识别方法。首先通... 该文研究了电子商务领域同义词的自动识别问题。电子商务领域的同义词是指对同一事物或概念的不同表达,即在商品描述和检索中可以相互替换的词,针对该领域新词多、错别字多、近义词多的特点,提出基于用户行为的同义词识别方法。首先通过并列关系符号切分商品标题和基于SimRank思想聚集查询两种方法获取候选集合,进而获取两词的字面特征以及标题、查询、点击等用户行为特征,然后借助Gradient Boost Decision Tree模型判断是否同义。实验表明同义词识别准确率达到56.52%。 展开更多
关键词 同义词识别 用户行为 SIMRANK GRADIENT BOOST DECISION TREE
下载PDF
基于查询日志分析的中文网页关键词抽取方法 被引量:1
8
作者 王晓艳 王珍珍 《广西师范大学学报(自然科学版)》 CAS 北大核心 2015年第2期42-48,共7页
以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断,提出了单位篇幅停留时间... 以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断,提出了单位篇幅停留时间、逆向点击率、排名补偿因子3个指标,并对其进行综合加权。在查询串分词、同义词识别及多义词消歧、关键短语组配方面,也做了特殊处理。实验结果表明:抽取关键词的准确率较高,综合性能也高于TF.IDF和SVM方法。该方法能得到较满意的关键词抽取效果。 展开更多
关键词 查询日志 关键词抽取 关键短语组配 同义词识别 多义词消歧
下载PDF
基于知识库的网络信息概念挖掘(英文)
9
作者 章成志 侯汉清 《情报理论与实践》 CSSCI 北大核心 2004年第5期528-532,共5页
本文采用数据挖掘技术和情报语言学方法 ,构建了一个可以用于从因特网上提取信息、进行自动标引和自动分类的系统 ,提供了一种创建自动分类知识库的新方法 ;提出了一种用于主题抽取的位置加权算法 ,研制了一种改进汉语同义词识别性能的... 本文采用数据挖掘技术和情报语言学方法 ,构建了一个可以用于从因特网上提取信息、进行自动标引和自动分类的系统 ,提供了一种创建自动分类知识库的新方法 ;提出了一种用于主题抽取的位置加权算法 ,研制了一种改进汉语同义词识别性能的新方法 ,并在自动分类时运用了这种语义相似度识别算法。 展开更多
关键词 知识库 网络信息挖掘 概念挖掘 因特网 自动分类 自动标引 同义词识别
下载PDF
融合多层次信息的海关同义词识别方法
10
作者 刘大为 车超 魏小鹏 《计算机科学》 CSCD 北大核心 2022年第S02期159-163,共5页
在海关进出口商品文本信息中,往往会用不同的词语描述同一商品的特征,识别这些商品的特征同义词能更好地进行观点汇总,进而对同一类特征的商品进行涉税风险的防控。针对海关申报要素短语的特点,提出一种融合多层次信息的卷积神经网络模... 在海关进出口商品文本信息中,往往会用不同的词语描述同一商品的特征,识别这些商品的特征同义词能更好地进行观点汇总,进而对同一类特征的商品进行涉税风险的防控。针对海关申报要素短语的特点,提出一种融合多层次信息的卷积神经网络模型,构建并训练了一个基于孪生和三级网络结构的Sentence-BERT,其对相近的要素短语具有更好的语义表示,弥补了word2vec短文本词嵌入特征离散稀疏的不足。利用多尺寸卷积核提取要素短语的不同特征。通过BiLSTM神经网络学习要素短语的语序信息,并利用注意力机制分配关键词权重。获得的全连接融合同义词语义特征和关键词特征,通过softmax层进行预测。实验证明,融合多层次信息的卷积模型比其他模型有更好的表现。 展开更多
关键词 海关商品 同义词识别 要素短语 多层次信息 卷积神经网络
下载PDF
基于情报检索的汉语同义词识别初探 被引量:11
11
作者 刘华梅 侯汉清 《情报理论与实践》 CSSCI 北大核心 2005年第4期373-375,382,共4页
随着计算机的飞速发展,自然语言越来越广泛地应用于情报检索,同义词控制问题也成为情报学的研究热点。本文提出一种识别同义词的方法,这种方法基于检索网络搜索得到的统计数据,使用Dice测度方法测量两个词的相关度,相关度在给定的阈值... 随着计算机的飞速发展,自然语言越来越广泛地应用于情报检索,同义词控制问题也成为情报学的研究热点。本文提出一种识别同义词的方法,这种方法基于检索网络搜索得到的统计数据,使用Dice测度方法测量两个词的相关度,相关度在给定的阈值内就可以认为是同义词。通过分析测试结果,验证这种方法的可行性,并提出了这种方法的优缺点及其应用。 展开更多
关键词 情报检索 同义词 识别 汉语 自然语言 研究热点 控制问题 统计数据 网络搜索 测度方法 分析测试 相关度 计算机 情报学 可行性 优缺点 应用
下载PDF
利用D-S证据理论进行特征融合的同义实体识别 被引量:7
12
作者 何晶晶 蔡德胜 +1 位作者 介飞 吴共庆 《计算机应用研究》 CSCD 北大核心 2018年第5期1429-1433,共5页
针对现实中同一实体存在不同表象的问题,提出一种基于D-S证据理论特征融合的同义实体识别方法。以搜索引擎为外部知识库获取实体特征信息,利用相似函数计算特征值,由D-S证据理论融合一组特征值,经阈值判断完成同义实体的识别。特征融合... 针对现实中同一实体存在不同表象的问题,提出一种基于D-S证据理论特征融合的同义实体识别方法。以搜索引擎为外部知识库获取实体特征信息,利用相似函数计算特征值,由D-S证据理论融合一组特征值,经阈值判断完成同义实体的识别。特征融合识别算法在医疗机构数据集上的识别精度、召回率和F值分别达到了85.80%、81.18%、83.43%,比单纯利用实体名的算法分别提高了4.09%、4.30%和4.21%。实验表明D-S证据理论将多特征融合,对同义实体识别具有更好的识别效果。 展开更多
关键词 D-S证据理论 特征融合 同义实体识别 搜索引擎 相似函数
下载PDF
融合机器翻译与BERT-Whitening的同义句识别研究
13
作者 胡献君 杜莹 林鑫 《情报科学》 CSSCI 北大核心 2024年第6期83-88,98,共7页
【目的/意义】构建机器翻译与BERT-Whitening结合的句子同义识别模型,可以提升同义句识别效果,为下游的信息资源管理与服务应用提供支撑。【方法/过程】首先对同义句的类型及特点进行分析,在此基础上构建融合机器翻译与BERT-Whitening... 【目的/意义】构建机器翻译与BERT-Whitening结合的句子同义识别模型,可以提升同义句识别效果,为下游的信息资源管理与服务应用提供支撑。【方法/过程】首先对同义句的类型及特点进行分析,在此基础上构建融合机器翻译与BERT-Whitening的同义句识别模型,并通过实验对模型效果进行验证。其中,识别模型由句子预处理、候选同义句识别、嵌入式文本表示与基于相似度融合的同义判断等四个部分构成。【结果/结论】实验结果表明,机器翻译与BERT-Whitening结合模型的准确率、召回率和F1分别达到了0.840、0.859和0.849,明显高于对照组。【创新/局限】未在专业性较强的领域文本验证,普适性验证不足,且准确率、召回率提升空间较大。 展开更多
关键词 机器翻译 BERT-Whitening 同义句识别 同义 深度学习
原文传递
基于同义实体识别的Web信息集成 被引量:3
14
作者 徐喆昊 吴共庆 胡学钢 《计算机系统应用》 2015年第9期35-42,共8页
准确有效地集成海量Web信息,是Web信息动态聚合、市场情报分析、舆情分析、商业智能等分析型应用的重要基础.针对数据集成过程中不同实体指代同一实体的问题,利用搜索引擎返回的页面摘要信息,设计并实现了一种基于搜索引擎的同义实体识... 准确有效地集成海量Web信息,是Web信息动态聚合、市场情报分析、舆情分析、商业智能等分析型应用的重要基础.针对数据集成过程中不同实体指代同一实体的问题,利用搜索引擎返回的页面摘要信息,设计并实现了一种基于搜索引擎的同义实体识别算法FSE,并提出了一种基于同义实体识别的Web信息集成框架.在医院信息集成测试数据集上的实验结果表明,FSE算法效果优于基于Varient Dice、Varient Cosine、Varient Jaccard、Varient Overlap相似度计算的同义实体识别算法. 展开更多
关键词 WEB信息集成 同义实体识别 相似度计算 搜索引擎
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部