期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
消除语义网络中分词歧义方法研究 被引量:2
1
作者 陈晓明 李玲俐 梁雄友 《微电子学与计算机》 CSCD 北大核心 2012年第3期178-181,共4页
针对计算机语义网络中交集型和组合型词汇岐义的问题,通过分析了传统分词方法中存在的缺陷,提出基于最大概率计算的自动分词歧义方法.运用上下文语义相关度对产生歧义的词汇进行有效修正,重新计算切分候选词所产生的有效"费用&quo... 针对计算机语义网络中交集型和组合型词汇岐义的问题,通过分析了传统分词方法中存在的缺陷,提出基于最大概率计算的自动分词歧义方法.运用上下文语义相关度对产生歧义的词汇进行有效修正,重新计算切分候选词所产生的有效"费用",运用最大概率计算法对产生歧义的词汇进行关联程度概率计算,克服传统分词方法的弊端.成功地解决交集型岐义、连环交集型岐义、组合型岐义、混合型岐义切分问题,消除语义网络中的交集型和组合型词汇岐义的影响,取得了不错的效果. 展开更多
关键词 动分词 最大概率法
下载PDF
交叉熵——计算语言学消歧的一种工具 被引量:2
2
作者 索娟娟 李彦苍 《数学的实践与认识》 CSCD 北大核心 2006年第3期267-273,共7页
歧义问题的描述和消除问题是制约计算语言学发展的瓶颈问题.将交叉熵引入计算语言学消岐领域.采用语句的真实语义作为交叉熵的训练集的先验信息,将机器翻译的语义作为测试集后验信息,计算两者的交叉熵,并以交叉熵指导对歧义的辨识和消除... 歧义问题的描述和消除问题是制约计算语言学发展的瓶颈问题.将交叉熵引入计算语言学消岐领域.采用语句的真实语义作为交叉熵的训练集的先验信息,将机器翻译的语义作为测试集后验信息,计算两者的交叉熵,并以交叉熵指导对歧义的辨识和消除.实例表明,该方法简洁有效,易于计算机自适应实现,交叉熵不失为计算语言学消岐的一种较为有效的工具. 展开更多
关键词 计算语盲学 歧义 交叉熵
原文传递
歧义词挖掘与机器翻译优化方法 被引量:1
3
作者 孙李丽 郭琳 张文诺 《信息技术》 2022年第8期27-32,37,共7页
为了提高机器翻译的准确性和效率,挖掘识别歧义词和优化翻译算法成为技术关键。文中提出,基于文学作品建立歧义词的高频词典和低频词典,提炼出固定词式,迭代筛选最佳词义项,然后利用特征对齐置信度,对中英双语文本进行对齐识别,实现消... 为了提高机器翻译的准确性和效率,挖掘识别歧义词和优化翻译算法成为技术关键。文中提出,基于文学作品建立歧义词的高频词典和低频词典,提炼出固定词式,迭代筛选最佳词义项,然后利用特征对齐置信度,对中英双语文本进行对齐识别,实现消岐目的。最后采用评价指标,测试了传统算法与本文算法的翻译性能。结果表明,本文算法的消岐性能高于传统算法,长篇小说高于中篇小说。本文算法在人名、称呼、物品和俚语等固定词式的筛选与识别方面性能突出,能快速适应作品特色语言,降低歧义词翻译的错误率,提高机器翻译质量。 展开更多
关键词 机器翻译 歧义词 挖掘与识别 乡土小说
下载PDF
一种基于Perl的词义消岐方法研究与设计
4
作者 史海峰 施静 《电脑知识与技术》 2009年第8X期6765-6765,6776,共2页
该文介绍了一种基于Linux环境使用Perl语言实现的词义消岐小系统,算法主要由预处理、计算词向量和上下文向量多义词向量几个过程。通过计算某一义项与目标项的义项词语所具有相似性,比指示其他义项词语具有更强的相似性,以此为基础来完... 该文介绍了一种基于Linux环境使用Perl语言实现的词义消岐小系统,算法主要由预处理、计算词向量和上下文向量多义词向量几个过程。通过计算某一义项与目标项的义项词语所具有相似性,比指示其他义项词语具有更强的相似性,以此为基础来完成多义词词义的消歧工作.并对语料进行实验得出结果分析不足,待进一步研究。 展开更多
关键词 义项 向量
下载PDF
基于灰熵的汉语机器翻译消歧研究
5
作者 索娟娟 于宝英 《科技信息》 2012年第3期39-39,41,共2页
为了更有效的克服歧义这一汉语机器翻译的瓶颈问题,提高汉语自动分词精度,采用改进蚁群算法和灰熵对汉语的自动分词问题进行了研究。在构造分词模型的基础上,以灰熵度量分词的准确性。应用实例证明了方法的有效性。该方法对于提高我国... 为了更有效的克服歧义这一汉语机器翻译的瓶颈问题,提高汉语自动分词精度,采用改进蚁群算法和灰熵对汉语的自动分词问题进行了研究。在构造分词模型的基础上,以灰熵度量分词的准确性。应用实例证明了方法的有效性。该方法对于提高我国机器翻译水平,提高我国数字化水平具有重要意义。 展开更多
关键词 计算语言学 自动分词 灰熵
下载PDF
基于粗集的汉语词语义项知识的获取 被引量:7
6
作者 杨尔弘 郝秀兰 李盛 《中文信息学报》 CSCD 北大核心 2002年第3期27-33,共7页
由于自然语言语序的灵活性 ,使得自然语言知识的自动获取很困难。本文基于粗糙集理论的属性值约简方法 ,结合基于记忆的学习 (MemoryBasedLearning ,简称MBL) ,提出了一种汉语多义动词义项知识的获取方法 。
关键词 义项知识 粗集 记忆学习 汉语多义动词 知识获取 自然语言处理 词义
下载PDF
一种基于Hownet的词向量表示方法 被引量:11
7
作者 陈洋 罗智勇 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第1期22-28,共7页
针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷,提出一种基于Hownet的词向量表示方法(H-WRL)。首先,基于义原独立性假设,将Hownet中所有N个义原指定为欧式空间的一个标准正交基,实现Hownet义原向量初始化;然后... 针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷,提出一种基于Hownet的词向量表示方法(H-WRL)。首先,基于义原独立性假设,将Hownet中所有N个义原指定为欧式空间的一个标准正交基,实现Hownet义原向量初始化;然后,根据Hownet中词语与义原之间的定义关系,将词语向量表示视为相关义原所张成的子空间中的投影,并提出学习词向量表示的深度神经网络模型。实验表明,基于Hownet的词向量表示在词相似度计算和词义消歧两项标准评测任务中均取得很好的效果。 展开更多
关键词 词向量表示 HOWNET 词语相似性计算 词义
下载PDF
中文问句分类特征的研究 被引量:8
8
作者 牛彦清 陈俊杰 +1 位作者 段利国 张巍 《计算机应用与软件》 CSCD 北大核心 2012年第3期108-111,共4页
针对"不同的问句分类特征对问句分类的影响不相同,提取和处理这些特征的时间复杂度也不相同"的问题,提取问题疑问词、核心关键词(疑问词的一二级依存词和问句中心语)的主要义原、核心关键词的首义原、问句主谓宾的主要义原、... 针对"不同的问句分类特征对问句分类的影响不相同,提取和处理这些特征的时间复杂度也不相同"的问题,提取问题疑问词、核心关键词(疑问词的一二级依存词和问句中心语)的主要义原、核心关键词的首义原、问句主谓宾的主要义原、命名实体、名词单(复)数等六种分类特征,采用支持向量机分类算法,对事实疑问句进行不同特征组合的分类对比实验,发现采用词义消岐技术提取的主要义原不仅对分类的准确率影响明显,而且大幅降低特征向量的维数,减少了处理时间。 展开更多
关键词 问题分类 主要义原 词义 支持向量机
下载PDF
基于上下文特征的短文本实体链接研究 被引量:4
9
作者 武川 陆伟 《情报科学》 CSSCI 北大核心 2016年第2期144-147,160,共5页
本文构建了一个面向短文本的实体链接系统,致力于鉴别出文本中指向Freebase实体的文本片段。本文将实体链接分为两步,利用现有的实体指称识别方法鉴别出实体指称,随后利用三类特征进行实体消岐,包括:实体指称-实体相似度、实体-实体相... 本文构建了一个面向短文本的实体链接系统,致力于鉴别出文本中指向Freebase实体的文本片段。本文将实体链接分为两步,利用现有的实体指称识别方法鉴别出实体指称,随后利用三类特征进行实体消岐,包括:实体指称-实体相似度、实体-实体相似度、候选实体上下文指称相似度。通过考虑所有的实体指称-实体对,选择得分最高的作为实体链接结果。 展开更多
关键词 实体识别 实体 实体链接
原文传递
基于实体消岐和多粒度注意力的知识库问答 被引量:3
10
作者 何儒汉 唐娇 +3 位作者 史爱武 陈佳 李相朋 胡新荣 《计算机工程与设计》 北大核心 2022年第2期560-566,共7页
为解决现有知识库问答编码-比较框架的原始信息丢失问题,提出基于实体消岐和多粒度注意力的知识库问答方法。从多个粒度对问题和知识库关系的相关性进行建模,引入双向注意力机制更有效地聚合向量保留原始信息,实现关系检测中字符之间的... 为解决现有知识库问答编码-比较框架的原始信息丢失问题,提出基于实体消岐和多粒度注意力的知识库问答方法。从多个粒度对问题和知识库关系的相关性进行建模,引入双向注意力机制更有效地聚合向量保留原始信息,实现关系检测中字符之间的细粒度对齐。为提高实体链接的准确率,融合双向长短时记忆网络-条件随机场(BiLSTM-CRF)克服对人工特征的依赖,计算问题关系词与候选关系的相似性减少噪声数据实现实体消歧。在SimpleQuestions数据集的实验结果表明,该模型在准确率上有明显提升,达到了94.1%。 展开更多
关键词 命名实体识别 实体 关系检测 注意力机制 知识库问答
下载PDF
基于微博文本的层次化实体链接方法 被引量:2
11
作者 李禹恒 宋俊 +3 位作者 黄宇 付琨 吴一戎 陈昊 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2016年第3期904-910,共7页
首先基于用户偏好一致性假设,根据信息函数对所有提及进行排序,得到歧义最小的提及,利用消歧算法消歧,并将返回的确认实体纳入消歧函数。通过这种迭代策略让正确的结果正向传递给下一层更模糊的消歧任务。在人工标注测试集上的实验结果... 首先基于用户偏好一致性假设,根据信息函数对所有提及进行排序,得到歧义最小的提及,利用消歧算法消歧,并将返回的确认实体纳入消歧函数。通过这种迭代策略让正确的结果正向传递给下一层更模糊的消歧任务。在人工标注测试集上的实验结果表明,本文方法具有良好的性能。 展开更多
关键词 计算机应用 实体链接 文本 数据挖掘
下载PDF
瞬态执行漏洞攻击及防御综述 被引量:2
12
作者 李晔 李沛南 +3 位作者 赵路坦 侯锐 张立新 孟丹 《高技术通讯》 EI CAS 北大核心 2020年第8期774-782,共9页
介绍了瞬态执行漏洞的攻击及防御的研究现状,概述了利用现代处理器中由乱序执行和推测执行机制引起的超前执行窗口的熔断类漏洞和幽灵类漏洞,对观测微体系结构状态变化并窃取敏感信息的16个变种漏洞进行了分类,包括提前执行例外或中断... 介绍了瞬态执行漏洞的攻击及防御的研究现状,概述了利用现代处理器中由乱序执行和推测执行机制引起的超前执行窗口的熔断类漏洞和幽灵类漏洞,对观测微体系结构状态变化并窃取敏感信息的16个变种漏洞进行了分类,包括提前执行例外或中断后的指令漏洞和错误执行分支预测或访存消歧后的指令漏洞。讨论了缓存瞬态执行漏洞攻击的3个步骤、可恶意训练的微体系结构硬件和对应3个攻击步骤的防御方法。展望了处理器体系结构的发展方向,在设计处理器的伊始,将性能优化机制进行周密的安全性分析,兼顾性能和安全的架构是未来处理器微体系结构设计的重要趋势之一。 展开更多
关键词 瞬态执行 侧信道攻击 分支预测 乱序执行 内存 恶意训练分支预测器
下载PDF
基于多层次句子相似度与向量空间模型的词义消歧 被引量:2
13
作者 朱姝 张政 《北京工商大学学报(自然科学版)》 CAS 2009年第2期68-72,共5页
介绍和对比了20世纪50年代以来出现的各种主要词义消歧的方法,论述了这些方法取得的成效和存在的局限,着重讨论了基于向量空间模型的消歧方法.在此基础上,通过分析和计算,提出了一种将多层次句子相似度计算应用于向量空间模型的新方法,... 介绍和对比了20世纪50年代以来出现的各种主要词义消歧的方法,论述了这些方法取得的成效和存在的局限,着重讨论了基于向量空间模型的消歧方法.在此基础上,通过分析和计算,提出了一种将多层次句子相似度计算应用于向量空间模型的新方法,从而提高机器翻译中的词义消歧的准确度. 展开更多
关键词 词义 机器翻译 多层次句子相似度 向量空间模型 句子相似度
下载PDF
一种基于概念关联式的词义消岐方法 被引量:1
14
作者 缪建明 张全 《计算机科学》 CSCD 北大核心 2010年第1期208-210,共3页
词义排岐是自然语言处理中最关键也是最困难的问题之一,至今仍没有得到完全有效的解决。在研究HNC表达汉语知识的基础上,提出了一种基于概念关联式的汉语词义消歧方法,用于处理汉语的歧义字段。该方法综合了词语概念的层次性、网络性、... 词义排岐是自然语言处理中最关键也是最困难的问题之一,至今仍没有得到完全有效的解决。在研究HNC表达汉语知识的基础上,提出了一种基于概念关联式的汉语词义消歧方法,用于处理汉语的歧义字段。该方法综合了词语概念的层次性、网络性、结构性特征,用一种统一的表示式来规范这类特征,解决了多个不同概念之间的知识关联表示问题。实验对20个汉语高频多义词进行了测试,平均正确率为94%,验证了该方法的有效性。 展开更多
关键词 词义 概念关联式 HNC理论
下载PDF
基于Web知识的无监督英文目录标签消歧 被引量:1
15
作者 孙磊 《计算机应用与软件》 CSCD 2010年第9期224-227,282,共5页
词义消歧,作为自然语言处理领域最具挑战性的任务之一,目前正面临着知识获取瓶颈(Knowledge Acquisition Bottle-neck)的阻碍。目录标签消歧,作为词义消歧的又一崭新的应用领域,是轻量级本体学习(Lightweight Ontology Learning)中十分... 词义消歧,作为自然语言处理领域最具挑战性的任务之一,目前正面临着知识获取瓶颈(Knowledge Acquisition Bottle-neck)的阻碍。目录标签消歧,作为词义消歧的又一崭新的应用领域,是轻量级本体学习(Lightweight Ontology Learning)中十分重要的一个环节。旨在探索一种基于Web知识(不受知识获取瓶颈制约)并应用于目录标签消歧的词义消歧方法。其主要思想为:首先,利用Web知识(Web搜索引擎)和WordNet等外部资源,将待消歧词t的上下文c及n个候选词义s1…sn扩展为各自的向量形式,并提出的一种tf-idf变体(条件tf-idf)来计算向量中的分量值。之后,又提出一种新颖的混合消歧模型,综合考虑各候选词义与待消歧词上下文的相关度及候选词义先验分布这两个因素进行消歧。据了解,类似做法在基于Web的词义消歧中还未出现过。在实验中,在网页目录DMOZ的一个子集(共1100个待消歧词)上进行了实验。系统以100%的召回率达到83.40%的准确率,高于基线准确率(单纯根据词义先验分布消歧)73.37%达10个百分点。 展开更多
关键词 词义 基于Web知识 无监督 轻量级本体
下载PDF
基于图的联合特征实体链接方法 被引量:1
16
作者 周金 朱永华 +2 位作者 张铁男 邢毅雪 张克 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第5期747-755,共9页
实体链接是指将文本中的实体指称映射到知识库实体的过程,这一过程在知识图谱、知识融合领域都是关键的步骤之一.提出了一种基于图的联合特征实体链接方法,首先对知识库和文本进行预处理,然后识别文本中的命名实体指称,随后联合主题、... 实体链接是指将文本中的实体指称映射到知识库实体的过程,这一过程在知识图谱、知识融合领域都是关键的步骤之一.提出了一种基于图的联合特征实体链接方法,首先对知识库和文本进行预处理,然后识别文本中的命名实体指称,随后联合主题、上下文、元数据等多特征的语义相似度,在经扩充的图模型中利用重启随机游走和联合消歧选出指称的链接实体.实验结果表明,基于图的联合特征实体链接方法有效提高了实体链接效果. 展开更多
关键词 实体链接 实体 语义相似度 重启随机游走 自然语言处理
下载PDF
一种用于拷贝图像检索的视觉词汇消歧方法
17
作者 嵇新浩 《湘潭大学自然科学学报》 CAS 北大核心 2017年第1期64-68,共5页
为提高视觉词汇的区分能力,提出一种对视觉词汇过滤的方法.该方法能够对视觉词汇进行消岐,过滤大部分错误匹配的特征点.经实验验证本方法能够有效提高拷贝图像的检索效果.同时,该方法可以和其他后验证方法结合使用,当与其他后验证方法... 为提高视觉词汇的区分能力,提出一种对视觉词汇过滤的方法.该方法能够对视觉词汇进行消岐,过滤大部分错误匹配的特征点.经实验验证本方法能够有效提高拷贝图像的检索效果.同时,该方法可以和其他后验证方法结合使用,当与其他后验证方法一起使用时,不仅能够提高其他方法的检索效果而且能够提高其检索效率. 展开更多
关键词 拷贝图像检索 视觉词袋模型 视觉词汇 视觉词汇
下载PDF
《克兰福德镇》四个中文译本的翻译简单化趋势
18
作者 张琪 《淮海工学院学报(人文社会科学版)》 2016年第9期63-65,共3页
Baker针对翻译共性特征提出了六个假设,分别是显化现象、消岐和简化现象、泛化特点、倾向于避免重复、倾向于凸显目标语语言特征和某些特征呈现特定类型的分布。基于此理论,利用语料库软件对个人建立的《克兰福德镇》中文译本小型语料... Baker针对翻译共性特征提出了六个假设,分别是显化现象、消岐和简化现象、泛化特点、倾向于避免重复、倾向于凸显目标语语言特征和某些特征呈现特定类型的分布。基于此理论,利用语料库软件对个人建立的《克兰福德镇》中文译本小型语料库进行检索并分析总结,得出这四个中文译本中存在的翻译共性特征之消岐和简化现象。 展开更多
关键词 《克兰福德镇》 中文译本 翻译共性 和简化现象
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部