期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
97
篇文章
<
1
2
…
5
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
名动分类:语法的还是语义的——汉语名动分类的神经语言学研究
被引量:
41
1
作者
杨亦鸣
梁丹丹
+2 位作者
顾介鑫
翁旭初
封世文
《语言科学》
2002年第1期31-46,共16页
大多数名动分类实验的结果支持名词和动词的语义特征不同是人们区分二者的依据,但这些实验只是从语义角度来设计研究方案的,大大制约了其结论的语言学价值。本文从语法角度来设计研究方案,通过ERP、fMRI两种实验手段证明了语法确实可以...
大多数名动分类实验的结果支持名词和动词的语义特征不同是人们区分二者的依据,但这些实验只是从语义角度来设计研究方案的,大大制约了其结论的语言学价值。本文从语法角度来设计研究方案,通过ERP、fMRI两种实验手段证明了语法确实可以作为汉语名动分类的依据。
展开更多
关键词
名词
动词
词类
语法
语义
ERP
FMRI
下载PDF
职称材料
用语义模式提取实体关系的方法
被引量:
23
2
作者
邓擘
樊孝忠
杨立公
《计算机工程》
CAS
CSCD
北大核心
2007年第10期212-214,共3页
研究了信息抽取中的汉语实体关系提取技术,在使用模式匹配技术的基础上引入了词汇语义匹配技术对汉语实体关系进行提取。比较了一般模式匹配技术和词汇语义模式匹配技术在汉语实体关系提取任务中的性能。实验结果表明,一般模式匹配技术...
研究了信息抽取中的汉语实体关系提取技术,在使用模式匹配技术的基础上引入了词汇语义匹配技术对汉语实体关系进行提取。比较了一般模式匹配技术和词汇语义模式匹配技术在汉语实体关系提取任务中的性能。实验结果表明,一般模式匹配技术在处理中文时效果较差,而词汇语义模式匹配技术更适合于处理汉语实体关系提取任务。
展开更多
关键词
信息抽取
实体关系
模式匹配
词汇语义
下载PDF
职称材料
近十年汉语新词语的构词、语义、语用特点分析
被引量:
19
3
作者
惠天罡
《语言文字应用》
CSSCI
北大核心
2014年第4期26-34,共9页
汉语词汇灵敏地反映、记录着中国当代的社会生活,尤其是近十年来,政治、经济、教育、科技、文化迅速发展,各种媒体资源不断更新并推广,文化形态日益丰富,代表新概念、引领新时尚、概括新事物的新词语层出不穷,其覆盖面和影响力愈来愈大...
汉语词汇灵敏地反映、记录着中国当代的社会生活,尤其是近十年来,政治、经济、教育、科技、文化迅速发展,各种媒体资源不断更新并推广,文化形态日益丰富,代表新概念、引领新时尚、概括新事物的新词语层出不穷,其覆盖面和影响力愈来愈大,国家也日益重视记录、监控和研究新词语,在这一背景下,本文分析了近十年汉语新词语在构词、语义、语用方面呈现出的不同特点。
展开更多
关键词
新词语
构词
语义
语用
下载PDF
职称材料
基于语义与最大匹配度的短文本分类研究
被引量:
18
4
作者
孙建旺
吕学强
张雷瀚
《计算机工程与设计》
CSCD
北大核心
2013年第10期3613-3618,共6页
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出...
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出了基于语义与最大匹配度的方法计算短文本相似度,应用KNN算法进行短文本分类。实验结果表明,该方法与基于语义、基于AD_NB等方法相比,正确率、召回率和F值均得到了明显的提高。
展开更多
关键词
短文本分类
义原相似度
词语相似度
语义
最大匹配度
KNN算法
下载PDF
职称材料
基于语义依存的汉语句子相似度改进算法
被引量:
11
5
作者
黄洪
陈德锐
《浙江工业大学学报》
CAS
北大核心
2017年第1期6-9,共4页
现有的基于语义依存的汉语句子相似度算法仅考虑了基于核心词的有效搭配对,根据两个句子有效搭配对的对应词是否是相同词和同义词将匹配权重简单地处理为0,0.5和1,而且未考虑不直接依存于核心词的其他词语,导致在计算句子相似度时区分...
现有的基于语义依存的汉语句子相似度算法仅考虑了基于核心词的有效搭配对,根据两个句子有效搭配对的对应词是否是相同词和同义词将匹配权重简单地处理为0,0.5和1,而且未考虑不直接依存于核心词的其他词语,导致在计算句子相似度时区分度较低.改进算法通过综合计算核心词、关键词的语义相似度来确定更为精确的匹配权重,并且将不直接依存于核心词的其他词语对句子的影响也纳入句子相似度计算,以期达到全面刻画句子语义、提高算法的准确率和区分度的目的.实验结果表明改进算法比原算法具有更高的准确率以及更好的对句子的区分能力.
展开更多
关键词
相似度
语义依存
词语语义
知网
下载PDF
职称材料
基于WMF_LDA主题模型的文本相似度计算
被引量:
10
6
作者
张璐
芦天亮
杜彦辉
《计算机应用研究》
CSCD
北大核心
2019年第10期2916-2919,2951,共5页
利用LDA模型进行文本相似度的计算考虑到了语义特征,但是存在词语数量多、未结合词语语义、未从文本层面挖掘和利用不同类别文本固有的领域间差异的缺点。针对以上问题,提出WMF_LDA(词语合并与过滤潜在狄利克雷分布)主题模型。将领域词...
利用LDA模型进行文本相似度的计算考虑到了语义特征,但是存在词语数量多、未结合词语语义、未从文本层面挖掘和利用不同类别文本固有的领域间差异的缺点。针对以上问题,提出WMF_LDA(词语合并与过滤潜在狄利克雷分布)主题模型。将领域词和近义词进行统一化映射,并根据词性将文本进行过滤,最后再进行主题建模。实验证明,该方法使得建模时词语量大大减少,减少了建模过程的时间消耗,提高了最后的文本聚类的速度。并且与其他文本相似度方法相比,提出的方法在准确度上也有一定程度的提升。
展开更多
关键词
词语语义
词语合并
词性筛选
文本相似度
下载PDF
职称材料
数据交换中的数据格式转换
被引量:
1
7
作者
郝亚南
陈少飞
李天柱
《河北大学学报(自然科学版)》
CAS
2003年第2期215-220,共6页
随着Web应用的迅速发展 ,如何进行Web上各系统之间的数据交换成为一个十分重要的问题 .其中的核心是Web上的各种数据格式之间的相互转换 .本文以XML作为数据交换的中介 ,从语法和语义 2个角度出发 ,分析和比较了现有Web上的HTML ,Word及...
随着Web应用的迅速发展 ,如何进行Web上各系统之间的数据交换成为一个十分重要的问题 .其中的核心是Web上的各种数据格式之间的相互转换 .本文以XML作为数据交换的中介 ,从语法和语义 2个角度出发 ,分析和比较了现有Web上的HTML ,Word及PDF的数据格式以及它们同XML之间的相互转换技术 .
展开更多
关键词
格式交换
XML
HTML
word
PDF
语法
语义
下载PDF
职称材料
一种由低层视觉特征获取高层语义的图像检索方法
被引量:
4
8
作者
沈玉利
任建峰
郭雷
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第1期172-173,178,共3页
提出了一种在获取图像低层视觉特征(颜色)的基础上,利用语义网络对图像进行语义自动分类,从而建立起低层视觉特征和高层语义特征之间的联系的算法。最后,为了提高检索效率,引进相关反馈技术,实验证明这种方法是行之有效的。
关键词
主颜色
语义网络
图像语义
相关反馈
下载PDF
职称材料
基于《知网》2008的词语相似度计算
被引量:
7
9
作者
刘杰
郭宇
+1 位作者
汤世平
樊孝忠
《小型微型计算机系统》
CSCD
北大核心
2015年第8期1728-1733,共6页
《知网》是一部比较详尽的语义知识词典,含有丰富的语义信息和世界知识,研究其特定的语言描述方法是科学合理利用《知网》的关键.《知网》的知识系统描述语言方式也在不断改进和改善,已经从过去的线性方式发展为现在的立体、可嵌套的方...
《知网》是一部比较详尽的语义知识词典,含有丰富的语义信息和世界知识,研究其特定的语言描述方法是科学合理利用《知网》的关键.《知网》的知识系统描述语言方式也在不断改进和改善,已经从过去的线性方式发展为现在的立体、可嵌套的方式.因此,本文对《知网》2008版本所使用的描述方式进行介绍,并基于此描述方式实现了两种词语相似度计算方法.其中,方法一的设计思想源于《知网》2000版本的计算方法;方法二是对现有《知网》2008版本的计算方法进行了适当改进.实验结果表明,与现有《知网》2008版本的词语相似度计算方法进行比较,运用本文所实现两种方法,一些词语的相似度计算结果更为合理,从而更加符合人们的主观判断.
展开更多
关键词
义原
词语相似度
语义
《知网》
下载PDF
职称材料
融合词语语义与标签依赖的隐式篇章关系识别
10
作者
吕国英
郭校金
贾荣荣
《软件导刊》
2024年第4期1-7,共7页
中文隐式篇章关系识别旨在推断出两个论元间的篇章关系类型。然而,现有的方法往往忽略了论元中词语所蕴含的关键信息,并且仅考虑单个层级内的篇章关系类型,忽略了各层级间篇章关系的依赖关联。鉴于此,提出融合词语语义和标签依赖的方法...
中文隐式篇章关系识别旨在推断出两个论元间的篇章关系类型。然而,现有的方法往往忽略了论元中词语所蕴含的关键信息,并且仅考虑单个层级内的篇章关系类型,忽略了各层级间篇章关系的依赖关联。鉴于此,提出融合词语语义和标签依赖的方法,以序列生成的方式实现篇章关系识别,先根据相似度权重将词向量嵌入到字编码表示中,应用字词对齐注意力机制强调关键字、词信息,再采用标签注意力编码从蕴含词语语义的论元表示和篇章关系表示中获取篇章关系依赖性的上下文表示,以自下而上的方式预测顶层的篇章关系类型。此外,构建面向阅读理解篇章的篇章关系数据集,并在该数据集上展开实验,结果显示隐式篇章关系识别准确率和F1值分别达到74.19%和73.81%,最终验证了该方法的有效性。
展开更多
关键词
隐式篇章关系
词语语义
标签依赖
序列生成
下载PDF
职称材料
主题方面共享的领域主题层次模型
11
作者
万常选
张奕韬
+3 位作者
刘德喜
刘喜平
廖国琼
万齐智
《软件学报》
EI
CSCD
北大核心
2024年第4期1790-1818,共29页
层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且...
层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且不同父主题下的子主题之间还存在子领域方面共享的关联关系,在现有主题关系研究中没有合适的模型来生成这种领域主题层次.为了从领域文本中自动、有效地挖掘出领域主题的层次关系和关联关系,在4个方面进行创新研究.首先,通过主题共享机制改进nCRP构造方法,提出nCRP+层次构造方法,为主题模型中的主题提供具有分层主题方面共享的树形先验分布;其次,结合nCRP+和HDP模型构建重分层的Dirichlet过程,提出rHDP(reallocated hierarchical Dirichlet processes)层次主题模型;第三,结合领域分类信息、词语语义和主题词的领域代表性,定义领域知识,包括基于投票机制的领域隶属度、词语与领域主题的语义相关度和层次化的主题-词语贡献度;最后,通过领域知识改进rHDP主题模型中领域主题和主题词的分配过程,提出结合领域知识的层次主题模型rHDP_DK(rHDP with domain knowledge),并改进采样过程.实验结果表明,基于nCRP+的层次主题模型在评价指标方面均优于基于nCRP的层次主题模型(hLDA,nHDP)和神经主题模型(TSNTM);通过rHDP_DK模型生成的主题层次结构具有领域主题层次清晰、关联子主题的主题词领域差异明确的特点.此外,该模型将为领域主题层次提供一个通用的自动挖掘框架.
展开更多
关键词
层次主题模型
领域分类信息
词语语义
主题关联关系
层次化的采样过程
领域主题层次
下载PDF
职称材料
汉语中的性别歧视及其成因分析
被引量:
4
12
作者
江丽莉
《白城师范学院学报》
2005年第2期75-77,共3页
汉语中存在着大量的针对女性的性别歧视语言,本文首先从造字、构词、语义等方面论述了汉语中的性别歧视现象,然后从社会学角度进行了成因分析。这种探讨有助于我们了解并最终消除语言中的性别歧视现象。
关键词
性别歧视
造字
构词
语义
成因
下载PDF
职称材料
后缀式词语模“X替”的多维考察
13
作者
庞勇珍
骆明弟
《唐山学院学报》
2024年第4期35-41,共7页
后缀式词语模“X替”是较为开放且固定的结构槽:模槽“X”以单音节名词性成分为主,少数为谓词性成分;模标“替”定性为名词,意为“替身”。因此,“X替”的整体语法性质是名词,其语义为在某些方面有共同特点的基本可以相互替代的人物、...
后缀式词语模“X替”是较为开放且固定的结构槽:模槽“X”以单音节名词性成分为主,少数为谓词性成分;模标“替”定性为名词,意为“替身”。因此,“X替”的整体语法性质是名词,其语义为在某些方面有共同特点的基本可以相互替代的人物、事物、地点等。“X替”被广泛应用于演艺圈,随着不断地复制与传播,逐渐突破语言特区,广泛流行于互联网,具有集调侃明星、表示赞赏及表达喜爱于一体的人际功能。语言使用的经济原则、词语模的新造、语言表达的空位以及网络媒体的助推都是“X替”产生和发展的内在机制和动因。
展开更多
关键词
X替
词语模
形式
语义
语用
机制
下载PDF
职称材料
基于NLP技术的装备故障文本匹配算法研究
被引量:
5
14
作者
祖月芳
凌海风
吕永顺
《兵器装备工程学报》
CSCD
北大核心
2021年第11期204-208,共5页
基于当前装备故障诊断的现状,依据在装备维修手册、装备履历书以及装备管理信息系统中存在大量的装备故障和维修经验等数据,结合装备故障文本的特点,提出了一种融合词性、语义及词序因子的故障文本相似度计算方法。该方法将装备故障文...
基于当前装备故障诊断的现状,依据在装备维修手册、装备履历书以及装备管理信息系统中存在大量的装备故障和维修经验等数据,结合装备故障文本的特点,提出了一种融合词性、语义及词序因子的故障文本相似度计算方法。该方法将装备故障文本中词汇的词性、语义及位置关系相联系,在余弦公式的基础上,通过文本中的词汇之间的相似度与词性权重的关联关系,改进相似度计算方法,并引入词序相似度进一步优化文本相似度。实验表明,所提出的方法较其他方法有更好的精确率和召回率,有效提高了装备故障文本的匹配效果。
展开更多
关键词
装备故障文本
词向量
词性
语义
词序相似度
文本相似度
匹配算法
下载PDF
职称材料
隐马尔可夫模型在中文文本分词中应用研究
被引量:
5
15
作者
王庆福
《无线互联科技》
2016年第13期106-107,共2页
文本分词是各个互联网领域中的基础性工作。通过对平台涉及的文本串进行切词处理,对切词之后的短文本串更能够聚合用户。隐马尔可夫模型作为机器学习领域中重要算法,它能够进行各个状态之间的转换,对于文本中词语之间上下文语义关系、...
文本分词是各个互联网领域中的基础性工作。通过对平台涉及的文本串进行切词处理,对切词之后的短文本串更能够聚合用户。隐马尔可夫模型作为机器学习领域中重要算法,它能够进行各个状态之间的转换,对于文本中词语之间上下文语义关系、词语与词语之间前后向位置关系非常匹配,众多的开源分词工具都基于隐马尔可夫模型。
展开更多
关键词
文本分词
上下文语义
隐马尔可夫模型
下载PDF
职称材料
形容词做定语修饰名词前置与后置不同语义探析
被引量:
1
16
作者
李雨名
《技术与教育》
2023年第1期3-7,共5页
对英语中某些形容词做定语修饰名词前置与后置时,针对其语义不同的各种情形,借助权威辞书,进行了论证、总结和归纳。
关键词
形容词
定语
语序
语义
下载PDF
职称材料
基于词频和情景语义的产品特征提取方法
被引量:
4
17
作者
陈可嘉
郑晶晶
+1 位作者
靳健
赵政
《广西大学学报(自然科学版)》
CAS
北大核心
2020年第6期1413-1422,共10页
为解决目前产品特征提取方法在种子特征词集构建上存在需要大量人工标注、代表性不足等问题,提出一种基于词频和情景语义的产品特征提取方法。通过少量高频名词和关联规则构建种子特征词集,采用神经网络语言模型进行词向量训练,再通过...
为解决目前产品特征提取方法在种子特征词集构建上存在需要大量人工标注、代表性不足等问题,提出一种基于词频和情景语义的产品特征提取方法。通过少量高频名词和关联规则构建种子特征词集,采用神经网络语言模型进行词向量训练,再通过计算向量间余弦相似度对种子特征词集进行扩充,最后经人工分类后得到完整的产品特征词典。实验结果显示,该方法采用种子特征词集相似度排名前九的单词(top9)来进行产品特征扩充时效果最好,F1值达到了76.44%。此外,与K-means+Word2vec、LDA等方法在top5,top10,top15,top20水平上的对比实验表明,无论是准确率、召回率还是F1值,该方法都更优。
展开更多
关键词
产品特征提取
词频
情景语义
种子特征词集
词向量
文本挖掘
下载PDF
职称材料
形容词做定语修饰名词之语序习惯和语义指向研究
18
作者
李雨名
《技术与教育》
2023年第2期3-6,26,共5页
对英语中某些形容词做定语的语序及语义进行了分类归纳,总结出做定语修饰名词前置与后置在语义上有细微差别的形容词及某些形容词在与名词构成固定短语的位置要求,并对形容词做定语修饰名词时的语义异指现象进行了说明。
关键词
形容词
定语
语序
语义
前置
后置
下载PDF
职称材料
亲子互动情境中影响词性和语义识别的因素
19
作者
陈永香
李燕
彭圆圆
《心理科学》
CSCD
北大核心
2023年第6期1329-1335,共7页
为考察亲子互动情境中的线索如何影响词汇学习,本研究通过人类模拟范式,采用2(词汇:名词/动词)×3(线索:语言/情境/全线索)被试内设计,考察了30名成人对名词、动词的判断。结果发现:(1)动词词性和语义判断都比名词更容易。(2)动词...
为考察亲子互动情境中的线索如何影响词汇学习,本研究通过人类模拟范式,采用2(词汇:名词/动词)×3(线索:语言/情境/全线索)被试内设计,考察了30名成人对名词、动词的判断。结果发现:(1)动词词性和语义判断都比名词更容易。(2)动词词性在三种线索条件下都能正确判断,且全线索、语言线索优于情境线索;而名词词性仅在全线索条件下才能正确判断。(3)关于名词语义判断正确率,全线索>语言线索、情境线索;动词语义判断正确率,全线索>语言线索>情境线索。研究显示,汉语亲子互动情境中动词比名词更容易推断,这和英语不同。
展开更多
关键词
人类模拟范式
输入语
亲子互动
词性
语义
下载PDF
职称材料
楼盘广告中字母词语的语义及语用特征
被引量:
1
20
作者
闫谷一
《安阳师范学院学报》
2006年第3期120-122,共3页
本文对2005年大连新建楼盘广告语中的字母词语进行了量化分析,旨在通过具体量化数据及详实的语料透视其语义及语用特征。
关键词
字母词语
楼盘广告
语义
语用
下载PDF
职称材料
题名
名动分类:语法的还是语义的——汉语名动分类的神经语言学研究
被引量:
41
1
作者
杨亦鸣
梁丹丹
顾介鑫
翁旭初
封世文
机构
徐州师范大学语言研究所
南京师范大学文学院
中国科学院心理研究所
出处
《语言科学》
2002年第1期31-46,共16页
基金
国家社会科学基金重点项目(01AYY004)田
教育部人文社会科学研究"十五"规划项目(01JA740001)
+1 种基金
国家重点基础研究发展规划"973"项目(G1999054000)
江苏省哲学社会科学研究"十五"规划重点项目(K2-003)的资助
文摘
大多数名动分类实验的结果支持名词和动词的语义特征不同是人们区分二者的依据,但这些实验只是从语义角度来设计研究方案的,大大制约了其结论的语言学价值。本文从语法角度来设计研究方案,通过ERP、fMRI两种实验手段证明了语法确实可以作为汉语名动分类的依据。
关键词
名词
动词
词类
语法
语义
ERP
FMRI
Keywords
noun
verb
word
class
syntax
semantics
ERP
fMRI
分类号
H04 [语言文字—语言学]
下载PDF
职称材料
题名
用语义模式提取实体关系的方法
被引量:
23
2
作者
邓擘
樊孝忠
杨立公
机构
北京理工大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第10期212-214,共3页
文摘
研究了信息抽取中的汉语实体关系提取技术,在使用模式匹配技术的基础上引入了词汇语义匹配技术对汉语实体关系进行提取。比较了一般模式匹配技术和词汇语义模式匹配技术在汉语实体关系提取任务中的性能。实验结果表明,一般模式匹配技术在处理中文时效果较差,而词汇语义模式匹配技术更适合于处理汉语实体关系提取任务。
关键词
信息抽取
实体关系
模式匹配
词汇语义
Keywords
Information
extraction
Entity
relation
Pattern
match
word
semantics
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
近十年汉语新词语的构词、语义、语用特点分析
被引量:
19
3
作者
惠天罡
机构
首都师范大学国际文化学院
出处
《语言文字应用》
CSSCI
北大核心
2014年第4期26-34,共9页
文摘
汉语词汇灵敏地反映、记录着中国当代的社会生活,尤其是近十年来,政治、经济、教育、科技、文化迅速发展,各种媒体资源不断更新并推广,文化形态日益丰富,代表新概念、引领新时尚、概括新事物的新词语层出不穷,其覆盖面和影响力愈来愈大,国家也日益重视记录、监控和研究新词语,在这一背景下,本文分析了近十年汉语新词语在构词、语义、语用方面呈现出的不同特点。
关键词
新词语
构词
语义
语用
Keywords
neologism
word
-formation
semantics
pragmatic
分类号
H136 [语言文字—汉语]
下载PDF
职称材料
题名
基于语义与最大匹配度的短文本分类研究
被引量:
18
4
作者
孙建旺
吕学强
张雷瀚
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
出处
《计算机工程与设计》
CSCD
北大核心
2013年第10期3613-3618,共6页
基金
国家自然科学基金项目(61271304)
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)
文摘
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出了基于语义与最大匹配度的方法计算短文本相似度,应用KNN算法进行短文本分类。实验结果表明,该方法与基于语义、基于AD_NB等方法相比,正确率、召回率和F值均得到了明显的提高。
关键词
短文本分类
义原相似度
词语相似度
语义
最大匹配度
KNN算法
Keywords
short
text
classification
primary
similarity
word
similarity
the
semantics
maximum
matching
degree
KNN
algorithm
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于语义依存的汉语句子相似度改进算法
被引量:
11
5
作者
黄洪
陈德锐
机构
浙江工业大学计算机科学与技术学院
出处
《浙江工业大学学报》
CAS
北大核心
2017年第1期6-9,共4页
基金
国家自然科学基金资助项目(61202202)
浙江省人社厅钱江人才项目(QJ01302010)
文摘
现有的基于语义依存的汉语句子相似度算法仅考虑了基于核心词的有效搭配对,根据两个句子有效搭配对的对应词是否是相同词和同义词将匹配权重简单地处理为0,0.5和1,而且未考虑不直接依存于核心词的其他词语,导致在计算句子相似度时区分度较低.改进算法通过综合计算核心词、关键词的语义相似度来确定更为精确的匹配权重,并且将不直接依存于核心词的其他词语对句子的影响也纳入句子相似度计算,以期达到全面刻画句子语义、提高算法的准确率和区分度的目的.实验结果表明改进算法比原算法具有更高的准确率以及更好的对句子的区分能力.
关键词
相似度
语义依存
词语语义
知网
Keywords
similarity
semantic
dependency
word
semantics
HowNet
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于WMF_LDA主题模型的文本相似度计算
被引量:
10
6
作者
张璐
芦天亮
杜彦辉
机构
中国人民公安大学信息技术与网络安全学院
中国人民公安大学网络空间安全与法治协同创新中心
出处
《计算机应用研究》
CSCD
北大核心
2019年第10期2916-2919,2951,共5页
基金
国家重点研发计划重点专项资助项目(2017YFB0802804)
国家自然科学基金资助项目(61602489)
中国人民公安大学2018年基本科研业务费科研机构项目(2018JKF504)
文摘
利用LDA模型进行文本相似度的计算考虑到了语义特征,但是存在词语数量多、未结合词语语义、未从文本层面挖掘和利用不同类别文本固有的领域间差异的缺点。针对以上问题,提出WMF_LDA(词语合并与过滤潜在狄利克雷分布)主题模型。将领域词和近义词进行统一化映射,并根据词性将文本进行过滤,最后再进行主题建模。实验证明,该方法使得建模时词语量大大减少,减少了建模过程的时间消耗,提高了最后的文本聚类的速度。并且与其他文本相似度方法相比,提出的方法在准确度上也有一定程度的提升。
关键词
词语语义
词语合并
词性筛选
文本相似度
Keywords
word
semantics
word
merging
POS(part-of-speech)filtering
text
similarity
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
数据交换中的数据格式转换
被引量:
1
7
作者
郝亚南
陈少飞
李天柱
机构
河北大学数学与计算机学院
出处
《河北大学学报(自然科学版)》
CAS
2003年第2期215-220,共6页
文摘
随着Web应用的迅速发展 ,如何进行Web上各系统之间的数据交换成为一个十分重要的问题 .其中的核心是Web上的各种数据格式之间的相互转换 .本文以XML作为数据交换的中介 ,从语法和语义 2个角度出发 ,分析和比较了现有Web上的HTML ,Word及PDF的数据格式以及它们同XML之间的相互转换技术 .
关键词
格式交换
XML
HTML
word
PDF
语法
语义
Keywords
data
transformation
XML
HTML
word
PDF
syntax
semantics
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP393 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
一种由低层视觉特征获取高层语义的图像检索方法
被引量:
4
8
作者
沈玉利
任建峰
郭雷
机构
西北工业大学自动控制系
湛江海洋大学信息学院
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第1期172-173,178,共3页
基金
国防科工委基金资助项目
文摘
提出了一种在获取图像低层视觉特征(颜色)的基础上,利用语义网络对图像进行语义自动分类,从而建立起低层视觉特征和高层语义特征之间的联系的算法。最后,为了提高检索效率,引进相关反馈技术,实验证明这种方法是行之有效的。
关键词
主颜色
语义网络
图像语义
相关反馈
Keywords
Representative
color
word
net
Image
semantics
Relevance
feedback
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于《知网》2008的词语相似度计算
被引量:
7
9
作者
刘杰
郭宇
汤世平
樊孝忠
机构
首都师范大学信息工程学院
北京理工大学计算机学院
出处
《小型微型计算机系统》
CSCD
北大核心
2015年第8期1728-1733,共6页
基金
国家自然科学基金项目(61371194)资助
北京市自然科学基金项目(4152012)资助
北京市重点建设学科"计算机应用技术"和"通信与信息系统"资助
文摘
《知网》是一部比较详尽的语义知识词典,含有丰富的语义信息和世界知识,研究其特定的语言描述方法是科学合理利用《知网》的关键.《知网》的知识系统描述语言方式也在不断改进和改善,已经从过去的线性方式发展为现在的立体、可嵌套的方式.因此,本文对《知网》2008版本所使用的描述方式进行介绍,并基于此描述方式实现了两种词语相似度计算方法.其中,方法一的设计思想源于《知网》2000版本的计算方法;方法二是对现有《知网》2008版本的计算方法进行了适当改进.实验结果表明,与现有《知网》2008版本的词语相似度计算方法进行比较,运用本文所实现两种方法,一些词语的相似度计算结果更为合理,从而更加符合人们的主观判断.
关键词
义原
词语相似度
语义
《知网》
Keywords
sememe
word
similarity
semantics
"HowNet"
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合词语语义与标签依赖的隐式篇章关系识别
10
作者
吕国英
郭校金
贾荣荣
机构
山西大学计算机与信息技术学院
出处
《软件导刊》
2024年第4期1-7,共7页
基金
国家社会科学基金项目(18BYY009)。
文摘
中文隐式篇章关系识别旨在推断出两个论元间的篇章关系类型。然而,现有的方法往往忽略了论元中词语所蕴含的关键信息,并且仅考虑单个层级内的篇章关系类型,忽略了各层级间篇章关系的依赖关联。鉴于此,提出融合词语语义和标签依赖的方法,以序列生成的方式实现篇章关系识别,先根据相似度权重将词向量嵌入到字编码表示中,应用字词对齐注意力机制强调关键字、词信息,再采用标签注意力编码从蕴含词语语义的论元表示和篇章关系表示中获取篇章关系依赖性的上下文表示,以自下而上的方式预测顶层的篇章关系类型。此外,构建面向阅读理解篇章的篇章关系数据集,并在该数据集上展开实验,结果显示隐式篇章关系识别准确率和F1值分别达到74.19%和73.81%,最终验证了该方法的有效性。
关键词
隐式篇章关系
词语语义
标签依赖
序列生成
Keywords
implicit
discourse
relation
word
semantics
label
dependence
sequence
generation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
主题方面共享的领域主题层次模型
11
作者
万常选
张奕韬
刘德喜
刘喜平
廖国琼
万齐智
机构
江西财经大学信息管理学院
华东交通大学软件学院
江西省高校数据与知识工程重点实验室(江西财经大学)
出处
《软件学报》
EI
CSCD
北大核心
2024年第4期1790-1818,共29页
基金
国家自然科学基金(61972184,62272205,62272206,62076112)。
文摘
层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且不同父主题下的子主题之间还存在子领域方面共享的关联关系,在现有主题关系研究中没有合适的模型来生成这种领域主题层次.为了从领域文本中自动、有效地挖掘出领域主题的层次关系和关联关系,在4个方面进行创新研究.首先,通过主题共享机制改进nCRP构造方法,提出nCRP+层次构造方法,为主题模型中的主题提供具有分层主题方面共享的树形先验分布;其次,结合nCRP+和HDP模型构建重分层的Dirichlet过程,提出rHDP(reallocated hierarchical Dirichlet processes)层次主题模型;第三,结合领域分类信息、词语语义和主题词的领域代表性,定义领域知识,包括基于投票机制的领域隶属度、词语与领域主题的语义相关度和层次化的主题-词语贡献度;最后,通过领域知识改进rHDP主题模型中领域主题和主题词的分配过程,提出结合领域知识的层次主题模型rHDP_DK(rHDP with domain knowledge),并改进采样过程.实验结果表明,基于nCRP+的层次主题模型在评价指标方面均优于基于nCRP的层次主题模型(hLDA,nHDP)和神经主题模型(TSNTM);通过rHDP_DK模型生成的主题层次结构具有领域主题层次清晰、关联子主题的主题词领域差异明确的特点.此外,该模型将为领域主题层次提供一个通用的自动挖掘框架.
关键词
层次主题模型
领域分类信息
词语语义
主题关联关系
层次化的采样过程
领域主题层次
Keywords
hierarchical
topic
model
domain
taxonomy
word
semantics
correlated
relationships
of
topics
hierarchical
sampling
process
domain
topic
hierarchy
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
汉语中的性别歧视及其成因分析
被引量:
4
12
作者
江丽莉
机构
东北师范大学文学院
出处
《白城师范学院学报》
2005年第2期75-77,共3页
文摘
汉语中存在着大量的针对女性的性别歧视语言,本文首先从造字、构词、语义等方面论述了汉语中的性别歧视现象,然后从社会学角度进行了成因分析。这种探讨有助于我们了解并最终消除语言中的性别歧视现象。
关键词
性别歧视
造字
构词
语义
成因
Keywords
sexual
discrimination
word
-formation
semantics
cause
分类号
H109.2 [语言文字—汉语]
下载PDF
职称材料
题名
后缀式词语模“X替”的多维考察
13
作者
庞勇珍
骆明弟
机构
广西师范大学文学院/新闻与传播学院
出处
《唐山学院学报》
2024年第4期35-41,共7页
文摘
后缀式词语模“X替”是较为开放且固定的结构槽:模槽“X”以单音节名词性成分为主,少数为谓词性成分;模标“替”定性为名词,意为“替身”。因此,“X替”的整体语法性质是名词,其语义为在某些方面有共同特点的基本可以相互替代的人物、事物、地点等。“X替”被广泛应用于演艺圈,随着不断地复制与传播,逐渐突破语言特区,广泛流行于互联网,具有集调侃明星、表示赞赏及表达喜爱于一体的人际功能。语言使用的经济原则、词语模的新造、语言表达的空位以及网络媒体的助推都是“X替”产生和发展的内在机制和动因。
关键词
X替
词语模
形式
语义
语用
机制
Keywords
X-Ti(替)
word
model
form
semantics
pragmatics
mechanism
分类号
H136 [语言文字—汉语]
下载PDF
职称材料
题名
基于NLP技术的装备故障文本匹配算法研究
被引量:
5
14
作者
祖月芳
凌海风
吕永顺
机构
陆军工程大学野战工程学院
出处
《兵器装备工程学报》
CSCD
北大核心
2021年第11期204-208,共5页
文摘
基于当前装备故障诊断的现状,依据在装备维修手册、装备履历书以及装备管理信息系统中存在大量的装备故障和维修经验等数据,结合装备故障文本的特点,提出了一种融合词性、语义及词序因子的故障文本相似度计算方法。该方法将装备故障文本中词汇的词性、语义及位置关系相联系,在余弦公式的基础上,通过文本中的词汇之间的相似度与词性权重的关联关系,改进相似度计算方法,并引入词序相似度进一步优化文本相似度。实验表明,所提出的方法较其他方法有更好的精确率和召回率,有效提高了装备故障文本的匹配效果。
关键词
装备故障文本
词向量
词性
语义
词序相似度
文本相似度
匹配算法
Keywords
equipment
fault
text
word
vector
part
of
speech
semantics
word
order
similarity
text
similarity
matching
algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
隐马尔可夫模型在中文文本分词中应用研究
被引量:
5
15
作者
王庆福
机构
辽宁行政学院
出处
《无线互联科技》
2016年第13期106-107,共2页
文摘
文本分词是各个互联网领域中的基础性工作。通过对平台涉及的文本串进行切词处理,对切词之后的短文本串更能够聚合用户。隐马尔可夫模型作为机器学习领域中重要算法,它能够进行各个状态之间的转换,对于文本中词语之间上下文语义关系、词语与词语之间前后向位置关系非常匹配,众多的开源分词工具都基于隐马尔可夫模型。
关键词
文本分词
上下文语义
隐马尔可夫模型
Keywords
word
segmentation
context
semantics
hidden
Markov
model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
形容词做定语修饰名词前置与后置不同语义探析
被引量:
1
16
作者
李雨名
机构
吉林工业职业技术学院通识教育中心
出处
《技术与教育》
2023年第1期3-7,共5页
文摘
对英语中某些形容词做定语修饰名词前置与后置时,针对其语义不同的各种情形,借助权威辞书,进行了论证、总结和归纳。
关键词
形容词
定语
语序
语义
Keywords
adjectives
attributive
word
order
semantics
分类号
H314.2 [语言文字—英语]
下载PDF
职称材料
题名
基于词频和情景语义的产品特征提取方法
被引量:
4
17
作者
陈可嘉
郑晶晶
靳健
赵政
机构
福州大学经济与管理学院
北京师范大学政府管理学院
出处
《广西大学学报(自然科学版)》
CAS
北大核心
2020年第6期1413-1422,共10页
基金
国家自然科学基金资助项目(71701019)。
文摘
为解决目前产品特征提取方法在种子特征词集构建上存在需要大量人工标注、代表性不足等问题,提出一种基于词频和情景语义的产品特征提取方法。通过少量高频名词和关联规则构建种子特征词集,采用神经网络语言模型进行词向量训练,再通过计算向量间余弦相似度对种子特征词集进行扩充,最后经人工分类后得到完整的产品特征词典。实验结果显示,该方法采用种子特征词集相似度排名前九的单词(top9)来进行产品特征扩充时效果最好,F1值达到了76.44%。此外,与K-means+Word2vec、LDA等方法在top5,top10,top15,top20水平上的对比实验表明,无论是准确率、召回率还是F1值,该方法都更优。
关键词
产品特征提取
词频
情景语义
种子特征词集
词向量
文本挖掘
Keywords
product
feature
extraction
word
frequency
context
semantics
seed
feature
set
word
vector
text
mining
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
形容词做定语修饰名词之语序习惯和语义指向研究
18
作者
李雨名
机构
吉林工业职业技术学院通识教育中心
出处
《技术与教育》
2023年第2期3-6,26,共5页
文摘
对英语中某些形容词做定语的语序及语义进行了分类归纳,总结出做定语修饰名词前置与后置在语义上有细微差别的形容词及某些形容词在与名词构成固定短语的位置要求,并对形容词做定语修饰名词时的语义异指现象进行了说明。
关键词
形容词
定语
语序
语义
前置
后置
Keywords
adjective
attributive
word
order
semantics
preposition
postposition
分类号
H314.2 [语言文字—英语]
下载PDF
职称材料
题名
亲子互动情境中影响词性和语义识别的因素
19
作者
陈永香
李燕
彭圆圆
机构
湖南师范大学教育科学学院
山西大学教育科学学院
出处
《心理科学》
CSCD
北大核心
2023年第6期1329-1335,共7页
基金
国家社科基金青年项目(18CYY022)的资助。
文摘
为考察亲子互动情境中的线索如何影响词汇学习,本研究通过人类模拟范式,采用2(词汇:名词/动词)×3(线索:语言/情境/全线索)被试内设计,考察了30名成人对名词、动词的判断。结果发现:(1)动词词性和语义判断都比名词更容易。(2)动词词性在三种线索条件下都能正确判断,且全线索、语言线索优于情境线索;而名词词性仅在全线索条件下才能正确判断。(3)关于名词语义判断正确率,全线索>语言线索、情境线索;动词语义判断正确率,全线索>语言线索>情境线索。研究显示,汉语亲子互动情境中动词比名词更容易推断,这和英语不同。
关键词
人类模拟范式
输入语
亲子互动
词性
语义
Keywords
human
simulation
paradigm
language
input
parent-child
interaction
word
class
semantics
分类号
G63 [文化科学—教育学]
下载PDF
职称材料
题名
楼盘广告中字母词语的语义及语用特征
被引量:
1
20
作者
闫谷一
机构
辽宁师范大学文学院
出处
《安阳师范学院学报》
2006年第3期120-122,共3页
基金
辽宁省教育厅人文社科研究项目"全球拉丁化浪潮对汉语的影响:现代汉语中的字母词语研究"阶段性成果。
文摘
本文对2005年大连新建楼盘广告语中的字母词语进行了量化分析,旨在通过具体量化数据及详实的语料透视其语义及语用特征。
关键词
字母词语
楼盘广告
语义
语用
Keywords
letter
word
building
advertisements
semantics
pragmatics
分类号
H136 [语言文字—汉语]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
名动分类:语法的还是语义的——汉语名动分类的神经语言学研究
杨亦鸣
梁丹丹
顾介鑫
翁旭初
封世文
《语言科学》
2002
41
下载PDF
职称材料
2
用语义模式提取实体关系的方法
邓擘
樊孝忠
杨立公
《计算机工程》
CAS
CSCD
北大核心
2007
23
下载PDF
职称材料
3
近十年汉语新词语的构词、语义、语用特点分析
惠天罡
《语言文字应用》
CSSCI
北大核心
2014
19
下载PDF
职称材料
4
基于语义与最大匹配度的短文本分类研究
孙建旺
吕学强
张雷瀚
《计算机工程与设计》
CSCD
北大核心
2013
18
下载PDF
职称材料
5
基于语义依存的汉语句子相似度改进算法
黄洪
陈德锐
《浙江工业大学学报》
CAS
北大核心
2017
11
下载PDF
职称材料
6
基于WMF_LDA主题模型的文本相似度计算
张璐
芦天亮
杜彦辉
《计算机应用研究》
CSCD
北大核心
2019
10
下载PDF
职称材料
7
数据交换中的数据格式转换
郝亚南
陈少飞
李天柱
《河北大学学报(自然科学版)》
CAS
2003
1
下载PDF
职称材料
8
一种由低层视觉特征获取高层语义的图像检索方法
沈玉利
任建峰
郭雷
《计算机工程》
EI
CAS
CSCD
北大核心
2005
4
下载PDF
职称材料
9
基于《知网》2008的词语相似度计算
刘杰
郭宇
汤世平
樊孝忠
《小型微型计算机系统》
CSCD
北大核心
2015
7
下载PDF
职称材料
10
融合词语语义与标签依赖的隐式篇章关系识别
吕国英
郭校金
贾荣荣
《软件导刊》
2024
0
下载PDF
职称材料
11
主题方面共享的领域主题层次模型
万常选
张奕韬
刘德喜
刘喜平
廖国琼
万齐智
《软件学报》
EI
CSCD
北大核心
2024
0
下载PDF
职称材料
12
汉语中的性别歧视及其成因分析
江丽莉
《白城师范学院学报》
2005
4
下载PDF
职称材料
13
后缀式词语模“X替”的多维考察
庞勇珍
骆明弟
《唐山学院学报》
2024
0
下载PDF
职称材料
14
基于NLP技术的装备故障文本匹配算法研究
祖月芳
凌海风
吕永顺
《兵器装备工程学报》
CSCD
北大核心
2021
5
下载PDF
职称材料
15
隐马尔可夫模型在中文文本分词中应用研究
王庆福
《无线互联科技》
2016
5
下载PDF
职称材料
16
形容词做定语修饰名词前置与后置不同语义探析
李雨名
《技术与教育》
2023
1
下载PDF
职称材料
17
基于词频和情景语义的产品特征提取方法
陈可嘉
郑晶晶
靳健
赵政
《广西大学学报(自然科学版)》
CAS
北大核心
2020
4
下载PDF
职称材料
18
形容词做定语修饰名词之语序习惯和语义指向研究
李雨名
《技术与教育》
2023
0
下载PDF
职称材料
19
亲子互动情境中影响词性和语义识别的因素
陈永香
李燕
彭圆圆
《心理科学》
CSCD
北大核心
2023
0
下载PDF
职称材料
20
楼盘广告中字母词语的语义及语用特征
闫谷一
《安阳师范学院学报》
2006
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
5
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部