期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
语义增强型全文本共词网络的构建与分析
1
作者 赵一鸣 尹嘉颖 《情报学报》 CSCD 北大核心 2023年第10期1187-1198,共12页
共词网络是研究语言现象的重要方法,语义特征是词汇共现现象中重要的隐性知识,研究共现词之间的语义关系及特征,可以从语义视角改进共词网络的研究,并利用语义学知识为现有的共词分析方法赋能。本文提出了一种语义增强型的共词网络构建... 共词网络是研究语言现象的重要方法,语义特征是词汇共现现象中重要的隐性知识,研究共现词之间的语义关系及特征,可以从语义视角改进共词网络的研究,并利用语义学知识为现有的共词分析方法赋能。本文提出了一种语义增强型的共词网络构建和分析方法,从共现特征、网络特征与语义特征3个维度丰富了共词网络节点和边的属性。通过实验构建了基于14万余篇新闻文本数据的语义增强型全文本共词网络,并重点对共现词对的语义特征进行分析,结合案例呈现了该方法在计算语言学研究和行业应用上的价值。本文从词间语义关系的视角,拓展了共词网络的构建和分析方法,描述了共现词汇的语义特征,证实了语义关系的非对称性和传递性,为语义关系的分类与推导提供了理论依据,在语义消歧、词义理解等方面具有应用价值。 展开更多
关键词 词网络 词汇 语义关系 词分析 文本分析
下载PDF
面向新闻语料的中日命名实体翻译抽取 被引量:3
2
作者 尹存燕 黄书剑 +1 位作者 戴新宇 陈家骏 《小型微型计算机系统》 CSCD 北大核心 2015年第6期1393-1397,共5页
命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中抽取出命名实体翻译.基于中日双语新闻语料,对中日命名实体的翻译特征进行了分析,基于这些特征,提出一种... 命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中抽取出命名实体翻译.基于中日双语新闻语料,对中日命名实体的翻译特征进行了分析,基于这些特征,提出一种中日双语命名实体翻译自动抽取的方法,该方法融合了中日汉字翻译概率、片假名词汇和中文音译词汇的拼音相似度以及双语词汇共现等特征.实验表明本文方法充分利用这些特征,在语料规模不大的情况下,也可以取得较好的效果. 展开更多
关键词 命名实体 双语语料 对齐模型 拼音相似度 词汇
下载PDF
词汇衔接理论在大学英语词汇教学中的应用 被引量:1
3
作者 刘丽 《黑龙江教育学院学报》 2010年第11期159-162,共4页
词汇习得是语言技能赖以生存和发展的基础。然而传统大学英语词汇教学模式在一定程度上制约着学生英语实际应用能力的培养和提高。通过对词汇衔接理论的研究,从词汇复现和词汇共现两个方面探索新的英语词汇教学模式,可以使英语词汇教学... 词汇习得是语言技能赖以生存和发展的基础。然而传统大学英语词汇教学模式在一定程度上制约着学生英语实际应用能力的培养和提高。通过对词汇衔接理论的研究,从词汇复现和词汇共现两个方面探索新的英语词汇教学模式,可以使英语词汇教学进入篇章层次,让学生学会从篇章的角度去重新认识词汇的选择和组织在语言使用中的作用,从而促进其词汇习得和语言发展。 展开更多
关键词 词汇衔接 词汇习得 词汇 词汇
下载PDF
一种高稳定性词汇共现模型 被引量:2
4
作者 乔亚男 齐勇 侯迪 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第6期24-27,共4页
针对传统词汇共现模型存在的缺乏理论基础和稳定性欠佳等问题,提出了一种基于项场的高稳定性词汇共现模型.借鉴经典物理学中场的概念给出了项场的定义,其中项是语言的基本单位,是概念的抽象描述,而项场则是项在文档中的影响范围.在此基... 针对传统词汇共现模型存在的缺乏理论基础和稳定性欠佳等问题,提出了一种基于项场的高稳定性词汇共现模型.借鉴经典物理学中场的概念给出了项场的定义,其中项是语言的基本单位,是概念的抽象描述,而项场则是项在文档中的影响范围.在此基础上,引入量子场论将项与项的相关度类比为项场的叠加,由此给出了项与项之间距离和相关度的函数关系,并用其建立了词汇共现模型.实验结果证明,在小距离的情况下,所提模型中项的相关度大体呈常数,具有一定的窗口内稳定性,而同范畴的项对相关度振幅只有对照模型中最小振幅的26%,表明它具有较好的数据集稳定性. 展开更多
关键词 项场 词汇 窗口内稳定性 数据集稳定性
下载PDF
融入词汇共现的社交网络用户情感Biterm主题模型 被引量:2
5
作者 顾秋阳 吴宝 琚春华 《电信科学》 2020年第11期47-60,共14页
近年社交网络用户数量不断增加,基于文本的用户情感分析技术得到普遍关注和应用。但数据稀疏性、精度较低等问题往往会降低情感识别方法的精度和速度,提出了用户情感Biterm主题模型(US-BTM),从特定场所的文本中发现用户偏好及情感倾向,... 近年社交网络用户数量不断增加,基于文本的用户情感分析技术得到普遍关注和应用。但数据稀疏性、精度较低等问题往往会降低情感识别方法的精度和速度,提出了用户情感Biterm主题模型(US-BTM),从特定场所的文本中发现用户偏好及情感倾向,有效利用Biterm进行主题建模,并使用聚合策略形成伪文档,为整个文本集创建词汇配对以解决数据稀疏性和短文本等问题。通过词汇共现算法对主题进行研究,推断文本集级别信息的主题,并通过分析特定场景下的评论文本集中的词汇配对集及其相应主题的情感,达到准确预测用户对特定场景的兴趣、偏好和情感的目的。结果证明,所提方法能准确地捕捉用户的情感倾向,正确地揭示用户偏好,可广泛应用于社交网络的内容描述、推荐及社交网络用户兴趣描述、语义分析等多个领域。 展开更多
关键词 词汇 社交网络 用户情感 Biterm主题模型 聚合策略
下载PDF
使用词汇共现方法构建叙词表相关关系 被引量:1
6
作者 袁旭 常春 朱明 《情报理论与实践》 CSSCI 北大核心 2014年第2期127-130,102,共5页
以语义相关度的计算为切入点,选取"关键词—题名—摘要"共现方法,以图书馆学情报学领域作为研究对象,分6个步骤构建该领域叙词间相关关系。引入感知器算法,计算叙词间相关关系的强度大小。从疏松关系、等级关系和等同关系的排... 以语义相关度的计算为切入点,选取"关键词—题名—摘要"共现方法,以图书馆学情报学领域作为研究对象,分6个步骤构建该领域叙词间相关关系。引入感知器算法,计算叙词间相关关系的强度大小。从疏松关系、等级关系和等同关系的排除3个方面检验构建效果,验证得出使用文中的词汇共现方法可以构建专业叙词表的相关关系并取得较好效果。最后从切词、词距、对语料库的依赖和语料库的容量4个方面对实验进行了讨论。 展开更多
关键词 词汇 叙词表 语义相似度 相关度
原文传递
英语学习者受阻搭配使用的语料库研究 被引量:1
7
作者 孙海燕 《河南理工大学学报(社会科学版)》 2016年第4期462-468,共7页
基于语料库数据探讨学习者英语写作中的搭配使用特点,研究以名词situation为节点词,通过计算Z值的统计方法提取语料库中的典型搭配词,分析不同阶段英语学习者的搭配发展特征。中国学习者常常使用一些不合英语规范的受阻搭配,影响了语言... 基于语料库数据探讨学习者英语写作中的搭配使用特点,研究以名词situation为节点词,通过计算Z值的统计方法提取语料库中的典型搭配词,分析不同阶段英语学习者的搭配发展特征。中国学习者常常使用一些不合英语规范的受阻搭配,影响了语言产出的自然性和地道性。学生在动名搭配方面用词不精确,在形名搭配方面缺乏多样性。受阻搭配是一种不恰当的词汇共现形式,影响了语言产出的衔接性。 展开更多
关键词 语料库 学习者 受阻搭配 词汇
下载PDF
英语语篇中词汇共现的凸显 被引量:1
8
作者 吴琼 《湖南工业大学学报(社会科学版)》 2012年第5期140-142,共3页
词汇共现是实现语篇的完整及流畅的重要手段,词汇共现既受到显性语义的影响和制约,同时依赖于语言使用者的文化背景知识以及相关的情景语境,挖掘出词汇之间的隐性联系,可以增加词汇共现的多样性,并增强语篇的感染力、说服力和想象力。
关键词 词汇 语义 隐性语义 语境
下载PDF
语义相关词汇共现研究对大学英语词汇教学的启示
9
作者 范莎莎 《科教导刊(电子版)》 2019年第2期203-203,223,共2页
本文首先阐述了语义相关词汇并列共现、主题词意义复现和其他共现形式的语义相关词汇共现研究的内容,然后从扩大学生的词汇量、英语语义相关词汇的教学途径、联合语义进行词汇教学、利用语料库检索学习词汇、大学英语词汇教学思考这五... 本文首先阐述了语义相关词汇并列共现、主题词意义复现和其他共现形式的语义相关词汇共现研究的内容,然后从扩大学生的词汇量、英语语义相关词汇的教学途径、联合语义进行词汇教学、利用语料库检索学习词汇、大学英语词汇教学思考这五方面提出了大学英语词汇教学启示。希望对大学英语教师带来帮助,使其更好的进行英语词汇教学。 展开更多
关键词 语义相关词汇 词汇 大学英语 词汇教学
下载PDF
情感词汇共现网络的复杂网络特性分析 被引量:11
10
作者 余传明 周丹 《情报学报》 CSSCI 北大核心 2010年第5期906-914,共9页
本文从情感计算这一热点研究问题出发,分析了情感词汇共现网络的定义与构建原理,阐述了对其小世界效应、无标度特性、网络弹性、度相关性等复杂网络统计学特性进行研究的方法。为了检验这些统计学特性,从22157条网络评论中抽取出1284个... 本文从情感计算这一热点研究问题出发,分析了情感词汇共现网络的定义与构建原理,阐述了对其小世界效应、无标度特性、网络弹性、度相关性等复杂网络统计学特性进行研究的方法。为了检验这些统计学特性,从22157条网络评论中抽取出1284个情感词汇,并通过统计其在12000条评论语句中的共现情况建立了情感词汇共现网络。经计算,该网络的平均最短路径为2.89,群聚系数为0.19,表明其具有小世界效应;该网络的顶点度和边权重都呈幂律分布,表明其具有无标度特性。研究结果还表明,情感词汇共现网络的顶点度、顶点强度和顶点交互系数之间具有正相关性,是同类混合网络。 展开更多
关键词 词汇网络 复杂网络 小世界 无标度网络 顶点度分布
下载PDF
高斯混合模型与文本图卷积网络结合的虚假评论识别算法
11
作者 王星 刘贵娟 陈志豪 《计算机应用》 CSCD 北大核心 2024年第2期360-368,共9页
针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评... 针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评论在训练数据上相对正常评论数不足的边信号强度;然后,考虑到信源的多样性,综合文档、词汇和评论以及非文本特征构造邻接矩阵;最后,通过Text GCN的谱分解提取邻接矩阵的虚假评论关联结构实施预测。根据国内某大型电商平台采集的126086条实际中文评论数据开展实证研究,实验结果表明,F-Text GCN识别虚假评论的F1值达到82.92%,与预训练表征模型BERT和文本卷积神经网络相比分别提升了10.46%和11.60%,相较于只使用评论文本信源的Text GCN模型F1值提升了2.94%;研究了高仿虚假评论的预测错误率,在支持向量机(SVM)作用后难识别的评论样本上尝试二次识别,F-Text GCN整体预测准确率可达94.71%,相较于Text GCN和SVM,在识别准确率上分别提升了2.91%和14.54%。研究发现,虚假评论的二阶图邻居结构显示出较强的干预消费者决策的词汇,这表明所提算法特别适用于提取用于虚假评论检测的长程词语搭配结构和全局句子特征模式变化的场景。 展开更多
关键词 高斯混合模型 虚假评论识别 文本图卷积神经网络 邻接矩阵 词汇网络
下载PDF
基于信号传播算法的在线医疗咨询反馈内容评估方法 被引量:2
12
作者 刘通 杨敬成 《数据分析与知识发现》 CSSCI CSCD 2017年第11期29-36,共8页
【目的】设计并实现一种无监督的算法,对在线医疗咨询服务中医生反馈内容的准确性进行自动评估。【方法】基于大量的在线咨询记录构造词汇之间的共现关系,将其作为对给定咨询问题的标准反馈进行预测的统计模型。通过比较实际反馈和标准... 【目的】设计并实现一种无监督的算法,对在线医疗咨询服务中医生反馈内容的准确性进行自动评估。【方法】基于大量的在线咨询记录构造词汇之间的共现关系,将其作为对给定咨询问题的标准反馈进行预测的统计模型。通过比较实际反馈和标准反馈之间的相似性,可以获得医生反馈内容的准确性。【结果】通过对"好大夫在线"上的咨询记录进行评估,并与人工标注结果比对,本文算法在"严格匹配"和"软匹配"两种条件下可分别得到41.0%和82.4%的准确率。【局限】缺乏对文本中词汇顺序相关信息的考虑。【结论】本文算法可以帮助患者更有效地判断在线医疗信息的准确性,提升患者的就医决策效果。 展开更多
关键词 在线咨询 词汇网络 PAGERANK
原文传递
高阶信息检素问题相关研究进展
13
作者 乔亚男 齐勇 侯迪 《中国科技论文在线》 CAS 2009年第1期1-4,共4页
提出高阶信息检索问题这一概念,将多种信息检索的深层次问题统一在1个框架内,给出了词汇共现、语义查询扩展和统计语言模型3个高阶信息检索问题统一解决模型的技术基础,对高阶信息检索问题相关的研究进展进行了阐述,展望了高阶信息检索... 提出高阶信息检索问题这一概念,将多种信息检索的深层次问题统一在1个框架内,给出了词汇共现、语义查询扩展和统计语言模型3个高阶信息检索问题统一解决模型的技术基础,对高阶信息检索问题相关的研究进展进行了阐述,展望了高阶信息检索的发展趋势。 展开更多
关键词 计算机应用 信息检索.词汇
下载PDF
词汇共现关系视角下的大学英语四级写作
14
作者 李冰 李宏然 《吉林广播电视大学学报》 2009年第5期94-97,共4页
写作是大学英语四级考试的一个重要组成部分,同时也是大学英语教学的薄弱环节。衔接和连贯对高质量的四级作文至关重要,尤其是词汇共现关系的合理使用能使思想表达清楚,文章结构层次分明,促进语篇连贯。通过对四级范文的分析,揭示共现... 写作是大学英语四级考试的一个重要组成部分,同时也是大学英语教学的薄弱环节。衔接和连贯对高质量的四级作文至关重要,尤其是词汇共现关系的合理使用能使思想表达清楚,文章结构层次分明,促进语篇连贯。通过对四级范文的分析,揭示共现关系对提高作文质量的重要性并提出了大学英语四级写作教学建议。 展开更多
关键词 大学英语四级写作 衔接 连贯 词汇关系
原文传递
基于电影评论的情感词汇共现网络分析
15
作者 张琪 《传媒论坛》 2020年第16期151-152,共2页
针对微博评论文本的情感计算分析大多以情感词语为出发点,因此与情感词语有关的分析处理已经成为情感计算领域的重点.本文针对《我不是药神》电影评论语料进行预处理,构建情感词汇共现网络,并对情感词汇共现网络的统计学特征进行分析和... 针对微博评论文本的情感计算分析大多以情感词语为出发点,因此与情感词语有关的分析处理已经成为情感计算领域的重点.本文针对《我不是药神》电影评论语料进行预处理,构建情感词汇共现网络,并对情感词汇共现网络的统计学特征进行分析和可视化,包括小世界效应、无标度特征、网络社区结构特性、网络抗毁性分析.实证研究结果表明《,我不是药神》电影评论的情感词汇共现网络服从小世界效应,具有无标度特性,能够划分出明显的社区结构. 展开更多
关键词 情感词汇网络 小世界特性 无标度特性 社区特性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部