期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于图的同义词集自动获取方法 被引量:13
1
作者 吴云芳 石静 金澎 《计算机研究与发展》 EI CSCD 北大核心 2011年第4期610-616,共7页
同义词集是重要的语言基础知识,基于大规模语料库的同义词集自动获取是自然语言处理领域的一项基础性研究课题.从大规模语料中自动获取有并列结构关联的词语对,据此形成图,采用Newman算法对图进行划分而自动聚类相似词语.着重研究在New... 同义词集是重要的语言基础知识,基于大规模语料库的同义词集自动获取是自然语言处理领域的一项基础性研究课题.从大规模语料中自动获取有并列结构关联的词语对,据此形成图,采用Newman算法对图进行划分而自动聚类相似词语.着重研究在Newman算法的基础上,充分挖掘和利用并列结构的特性和汉语的构词特点,采用6种方法对图中边的权值加以改进从而提升效果:分割语料、去除低频边、加重双向边、加重团、加重相同后字、惩罚音节不等.同义词集自动获取的准确率从初始的23.28%提升至53.12%,准确率提高了约30个百分点. 展开更多
关键词 相似词 同义词集 图模型 并列结构 Newman算法 边权值
下载PDF
半监督自训练的方面提取 被引量:7
2
作者 曲昭伟 吴春叶 王晓茹 《智能系统学报》 CSCD 北大核心 2019年第4期635-641,共7页
方面提取是观点挖掘和情感分析任务中的关键一步,随着社交网络的发展,用户越来越倾向于根据评论信息来帮助进行决策,并且用户也更加关注评论的细粒度的信息,因此,从海量的网络评论数据中快速挖掘方面信息对于用户快速决策具有重要意义... 方面提取是观点挖掘和情感分析任务中的关键一步,随着社交网络的发展,用户越来越倾向于根据评论信息来帮助进行决策,并且用户也更加关注评论的细粒度的信息,因此,从海量的网络评论数据中快速挖掘方面信息对于用户快速决策具有重要意义。大部分基于主题模型和聚类的方法在方面提取的一致性上效果并不好,传统的监督学习的方法效果虽然表现很好,但是需要大量的标注文本作为训练数据,标注文本需要消耗大量的人力成本。基于以上问题,本文提出一种基于半监督自训练的方面提取方法,充分利用现存的大量未标签的数据价值,在未标签数据集上通过词向量模型寻找方面种子词的相似词,对每个方面建立与数据集最相关的方面表示词集合,本文方法避免了大量的文本标注,充分利用未标签数据的价值,并且本文方法在中文和英文数据集上都表现出了理想的效果。 展开更多
关键词 方面提取 词向量 半监督 自训练 未标签数据 观点挖掘 种子词 相似词
下载PDF
从四级考试作文答卷看学生在运用词汇方面存在的主要问题 被引量:4
3
作者 黄山 《天津农学院学报》 CAS 2002年第B06期79-80,89,共3页
从四级考试作文答卷中可以看出学生在运用英语词汇方面存在着一些带有普遍性的问题。本文对这些问题从词汇的音、形、义等 3个方面进行概括,并提出具体的、具有针对性的解决方法。
关键词 四级考试作文 读者 拼写 相似词 词类 语义词群 英语教学 词汇运用
下载PDF
中国境内毕苏语方言词汇差异比较 被引量:1
4
作者 季红丽 徐忆 李丹 《玉溪师范学院学报》 2011年第9期17-25,共9页
按照相同词、对应词、相似词和不同词4个标准对我国境内毕苏语的466个本词汇进行比较分析,并通过其结果初步预测我国境内毕苏语方言的差异情况。调查分析结果表明,在所比较的各毕苏方言词汇中,只有少部分词(29%)属于"不同词"... 按照相同词、对应词、相似词和不同词4个标准对我国境内毕苏语的466个本词汇进行比较分析,并通过其结果初步预测我国境内毕苏语方言的差异情况。调查分析结果表明,在所比较的各毕苏方言词汇中,只有少部分词(29%)属于"不同词",另有30%以上的词属于"相同词",其余词为"对应词"和"相似词"。这表明我国境内大部分毕苏词汇具有相通性,还暗示毕苏语内部具有较强的统一性和完整性。 展开更多
关键词 毕苏方言 毕苏词汇 相同词 对应词 相似词 不同词
下载PDF
英语形近词构成形式探析 被引量:2
5
作者 谭亚平 《长沙通信职业技术学院学报》 2004年第1期69-71,共3页
英语是目前世界上单词量最大的语言。在漫长而复杂的演变和发展过程中,其语言结构、修辞手段、语言习惯和词汇构成都形成了自己的特色。文章根据英语词汇构成的特点将拼写相近的词汇——形近词分成四类,并用例句进行了比较,文中对形近... 英语是目前世界上单词量最大的语言。在漫长而复杂的演变和发展过程中,其语言结构、修辞手段、语言习惯和词汇构成都形成了自己的特色。文章根据英语词汇构成的特点将拼写相近的词汇——形近词分成四类,并用例句进行了比较,文中对形近词的成因作了粗略分析。为了防止拼写错误,避免歧义讹用,正确阅读和翻译英语文献,对形近词的进一步的探讨有其必要性和实用价值。 展开更多
关键词 英语 形近词 构成形式 词义 词类 发音
下载PDF
学习材料组块方式对相似词长时记忆的影响 被引量:3
6
作者 张蕾 鲁成柔 +1 位作者 林军凤 梅磊磊 《心理学报》 CSSCI CSCD 北大核心 2019年第3期280-292,共13页
已有关于材料相似性影响短时记忆的研究提示,不相似材料组块相比于相似材料组块可能促进记忆。为验证该假设,该研究采用学习-测查范式,通过4个实验考察了学习材料组块方式对相似词长时记忆的影响及机制。结果发现:1)与相似词组块相比,... 已有关于材料相似性影响短时记忆的研究提示,不相似材料组块相比于相似材料组块可能促进记忆。为验证该假设,该研究采用学习-测查范式,通过4个实验考察了学习材料组块方式对相似词长时记忆的影响及机制。结果发现:1)与相似词组块相比,不相似词组块促进了相似词记忆;2)不相似词组块的促进效应是通过增强相似词表共同词根的记忆而实现的; 3)不相似词组块的促进效应可能依赖于语音相似性。该结果说明不相似词组块可能是促进相似词汇记忆的有效途径之一。 展开更多
关键词 学习-测查范式 词汇记忆 组块方式 相似词
下载PDF
基于POS-CBOW语言模型的相似词分析 被引量:3
7
作者 阮冬茹 潘洪岩 高凯 《河北科技大学学报》 CAS 2015年第5期532-538,共7页
相似词分析是自然语言处理领域的研究热点之一,在文本分类、机器翻译和信息推荐等领域中具有重要的研究价值和应用意义。针对新浪微博短文本的特点,给出一种带词性的连续词袋模型(POS-CBOW)。该模型在连续词袋模型的基础上加入过滤层和... 相似词分析是自然语言处理领域的研究热点之一,在文本分类、机器翻译和信息推荐等领域中具有重要的研究价值和应用意义。针对新浪微博短文本的特点,给出一种带词性的连续词袋模型(POS-CBOW)。该模型在连续词袋模型的基础上加入过滤层和词性标注层,对空间词向量进行优化和词性标注,通过空间词向量的余弦相似度和词性相似度来判别词向量的相似性,并利用统计分析模型筛选出最优相似词集合。实验表明,基于POS-CBOW语言模型的相似词分析算法优于传统CBOW语言模型。 展开更多
关键词 自然语言处理 语言模型 词向量 相似词 POS-CBOW
下载PDF
微博文本聚类中特征扩展策略研究 被引量:2
8
作者 段旭磊 张仰森 郭正斌 《计算机工程与应用》 CSCD 北大核心 2017年第13期90-94,195,共6页
针对微博文本高维、稀疏的特点,比较基于同义词词林等外部知识库的文本扩展策略,利用Word2vec训练微博语料,并构建微博上下文相关词词表,通过种子词表和微博标签信息去扩展微博文本流中的关键词,最后提出了提取微博文本关键词及区分词... 针对微博文本高维、稀疏的特点,比较基于同义词词林等外部知识库的文本扩展策略,利用Word2vec训练微博语料,并构建微博上下文相关词词表,通过种子词表和微博标签信息去扩展微博文本流中的关键词,最后提出了提取微博文本关键词及区分词向量中相似词和相关词的方法。实验结果证明,微博短文本经过Word2vec词向量相关词及微博标签扩展后,其聚类效果有了明显提高。 展开更多
关键词 微博文本 高维稀疏 关键词提取 相似词 相关词 特征扩展 聚类
下载PDF
跨语言交际中的词汇困惑及其对策——以日汉“同形异义词(字)”为例 被引量:2
9
作者 欧阳健 《湖南科技学院学报》 2005年第7期205-207,共3页
日语由于中日语言文字的历史渊源联系,其中有大量的汉字及日汉同形词,但由于各种原因,其日汉语意义并不完全相同(同形异义词、字)。这些同形异义词(字)也是造成日汉跨文化、语言交际障碍的重要因素(词汇困惑)。本文拟以日汉“同形异义词... 日语由于中日语言文字的历史渊源联系,其中有大量的汉字及日汉同形词,但由于各种原因,其日汉语意义并不完全相同(同形异义词、字)。这些同形异义词(字)也是造成日汉跨文化、语言交际障碍的重要因素(词汇困惑)。本文拟以日汉“同形异义词(字)”为例,对日汉跨语言交际中的词汇困惑及其对策进行分析、论述。 展开更多
关键词 同形异义词(字) 跨语言交际 困惑 对策
下载PDF
汉语相似词语混淆误用的可能性与方向性 被引量:1
10
作者 方绪军 李翠 《国际汉语教学研究》 2014年第1期41-48,共8页
一对相似词语A和B在学习者使用中会不会发生混淆误用及误用的频次高低,称为相似词语混淆误用的可能性;学习者只把A误用为B,或者既有把A误用为B,也有把B误用为A,这种现象称为相似词语混淆误用的方向性。本文基于"HSK动态作文语料库&... 一对相似词语A和B在学习者使用中会不会发生混淆误用及误用的频次高低,称为相似词语混淆误用的可能性;学习者只把A误用为B,或者既有把A误用为B,也有把B误用为A,这种现象称为相似词语混淆误用的方向性。本文基于"HSK动态作文语料库",考察《汉语水平词汇与汉字等级大纲》中的甲、乙级词语在该语料库中以"偏误词语—目标词语"形式出现的情况,分析学习者在使用常用词语时发生相似词语混淆误用的可能性和方向性。 展开更多
关键词 相似词语 中介语 偏误词语 目标词语
下载PDF
《説文》“牛,件也。件,事理也”試釋——漢字的形體部件藴含的詞義因素
11
作者 楊賀 楊端志 《文献语言学》 2022年第1期77-92,234,235,共18页
清代傳本《説文解字》牛部“牛,大牲也。牛,件也。件,事理也”。其中,“牛,大牲也”,從詞義角度理解,確如段注所云,同“馬,怒也,武也”“羊,祥也”一樣,所釋是許慎時代文化語境下的文化義。但是“牛,件也。件,事理也”放在“牛,大牲也”... 清代傳本《説文解字》牛部“牛,大牲也。牛,件也。件,事理也”。其中,“牛,大牲也”,從詞義角度理解,確如段注所云,同“馬,怒也,武也”“羊,祥也”一樣,所釋是許慎時代文化語境下的文化義。但是“牛,件也。件,事理也”放在“牛,大牲也”下,就不易理解了。自大徐本後的注釋家,紛紛提出異議,有7種不同的意見。我們認爲,這7種意見值得討論。依漢字構形字理,“牛”在牛部字中,符號化表達了同類詞的共同義素。本文進而以《説文》版本、本義系統、同部同類詞、異部同類詞這些本證,以語言中用例爲旁證,藉由確定本條的正誤,闡明漢字形體部件藴含的詞義信息。 展开更多
关键词 《説文》 本義 同部同類詞 異部同類詞 《説文》同類詞
下载PDF
二语学习者英语词汇的语音表征特征研究 被引量:1
12
作者 段田美 《长治学院学报》 2021年第1期66-73,40,共9页
语音表征是储存在长期记忆中的单词声音码的音系信息,它的准确与否直接影响到语言学习的质量。通过单词朗读,单词选择,音标判断,发音熟练度判断以及访谈等系列实验探究中国英语学习者英语词汇的语音表征特征。研究发现学习者语音表征呈... 语音表征是储存在长期记忆中的单词声音码的音系信息,它的准确与否直接影响到语言学习的质量。通过单词朗读,单词选择,音标判断,发音熟练度判断以及访谈等系列实验探究中国英语学习者英语词汇的语音表征特征。研究发现学习者语音表征呈以下特征:与形近词读音混淆;受目的语字母形的干扰;受汉语拼音字母音干扰。影响学习者语音表征的因素主要有:读音规则,单词拼写形式及英语学习环境。研究表明,在学习英语词汇发音时,单词的拼写形式起首要作用,拼写形式的存在先于声音形式的存在。音形联系不牢固严重影响中国英语学习者的词汇能力。 展开更多
关键词 语音表征 英语词汇 形近词 拼写形式
下载PDF
法律英语词法特征探微──同(近)义词的并置及翻译 被引量:2
13
作者 马雯 《佳木斯教育学院学报》 2013年第11期410-412,共3页
准确性是法律英语最重要的特点之一。这一特点使得法律英语拥有自己独特的词法特征,其中就包括了同(近)义词的并置现象。本文针对这种现象,提出了具体的翻译原则和方法。
关键词 同(近)义词 并置 词法特征 翻译
原文传递
对比语言学视野下的维吾尔语与朝鲜语音义相近词比较初探
14
作者 依斯马依力·艾肯木 李猛 《延边大学学报(社会科学版)》 2022年第4期76-84,142,共10页
我国是阿尔泰语言分布的主要地区之一,数量繁多且丰富。其中,维吾尔语属于阿尔泰语系语言;朝鲜语语系归属尚未有定论,国内外学者持有不同的观点,但大多数学者倾向于支持其是阿尔泰学假说。从语言类型学、形态学角度来看,维吾尔语与朝鲜... 我国是阿尔泰语言分布的主要地区之一,数量繁多且丰富。其中,维吾尔语属于阿尔泰语系语言;朝鲜语语系归属尚未有定论,国内外学者持有不同的观点,但大多数学者倾向于支持其是阿尔泰学假说。从语言类型学、形态学角度来看,维吾尔语与朝鲜语同属于黏着语,两种语言既有共性又有个性,并且语音、词汇、语法方面存在许多共同点。通过对有一定数量的维吾尔语与朝鲜语的音义相同或相近的词汇进行分类和比较分析,结果发现两种语言之间有一定数量的同源词。这些同源词不仅语义相同或相近,而且语音上也有对应关系。这些对应关系的词应该并非偶合,根据阿尔泰语言学理论假说它们应该来自共同母语——阿尔泰语。 展开更多
关键词 对比语言学 阿尔泰语 维吾尔语 朝鲜语 音义相近词 语音对应
下载PDF
西周金文形容词的系统性
15
作者 傅华辰 《皖西学院学报》 2011年第6期112-117,共6页
对西周金文形容词的词义系统进行研究,发现西周金文形容词不是孤立存在的,而是相互联系的。词义上的相互联系使西周金文形容词形成一个系统,其系统性主要体现在同义词、反义词和类义词的聚合关系上。从甲骨文到西周金文同义词和反义词... 对西周金文形容词的词义系统进行研究,发现西周金文形容词不是孤立存在的,而是相互联系的。词义上的相互联系使西周金文形容词形成一个系统,其系统性主要体现在同义词、反义词和类义词的聚合关系上。从甲骨文到西周金文同义词和反义词的聚合关系是不完全相同的,这说明词语的变化不仅是单个的词的变化,也是词语聚合关系的变化,从一个共时的词汇系统到另一个共时的词汇系统,词语的聚合关系进行了相应的调整。西周金文形容词中同义词、反义词和类义词的聚合关系有的一直在语言系统中传承,直到现代汉语词汇系统中仍然存在。 展开更多
关键词 西周金文 形容词 系统性 同义词 反义词 类义词
下载PDF
在线产品评论用户满意度综合评价研究 被引量:17
16
作者 吕品 钟珞 唐琨皓 《电子学报》 EI CAS CSCD 北大核心 2014年第4期740-746,共7页
文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五... 文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五种类型,克服了已有方法将情感分为满意和不满意的粗粒度定性评价缺陷。构建了用户满意度灰色评估模型,为了扩大对各类型产品评价的适应性,引用了相似性情感词匹配词对和对象对应产品的对应性热点词匹配词对来构建用户对产品和对象的满意度评测指标。以实际产品为实验数据对象,仿真结果表明:提出的方法不仅能获得产品或对象的总体满意度结论值VB,还能得到各项评测指标(影响产品或对象的因素)的量化评估结论值VBi,有效解决了定性评价方法的不足,为消费者提供了更详细的消费指导,为商业机构提供了有针对性的生产销售措施。 展开更多
关键词 在线产品评论 满意度评价 灰色理论 观点挖掘 相似性情感词匹配词对 对应性热点词匹配词对
下载PDF
语料资源缺乏的连续语音识别方法的研究 被引量:9
17
作者 伊·达瓦 匂坂芳典 中村哲 《自动化学报》 EI CSCD 北大核心 2010年第4期550-557,共8页
由于少数民族语言有其本身的特点,不能简单地套用现有的连续语音识别的方法.本文以蒙古语为例,研讨了声学和语言模型的建立,并在日本国际电气通信基础技术研究所的连续语音识别器上实现了蒙古语的语音识别系统.本文侧重于语言模型的建立... 由于少数民族语言有其本身的特点,不能简单地套用现有的连续语音识别的方法.本文以蒙古语为例,研讨了声学和语言模型的建立,并在日本国际电气通信基础技术研究所的连续语音识别器上实现了蒙古语的语音识别系统.本文侧重于语言模型的建立,基于蒙古语黏着性语言特点,提出用相似词聚类方法建立多类N-gram模型.实验结果显示,应用我们提出的语言模型,识别精度比用传统的词的N-gram识别法提高了5.5%. 展开更多
关键词 蒙古语 黏着语言 相似词分类 连续语语音识别 多类语言模型
下载PDF
古汉语词形讹误三例
18
作者 熊娟 《中国语文》 北大核心 2023年第1期90-97,128,共9页
古汉语文献中存在极少数因为缺乏版本异文而未被注意的词形讹误,有些讹误词形及其释义甚至还收录进了大型辞书,我们探讨了三例这样的词形讹误,它们都是由于文字形体近似造成的。一是“觕”讹作“捔”,二是“■”“■”讹作“檥”“蚁(蟻... 古汉语文献中存在极少数因为缺乏版本异文而未被注意的词形讹误,有些讹误词形及其释义甚至还收录进了大型辞书,我们探讨了三例这样的词形讹误,它们都是由于文字形体近似造成的。一是“觕”讹作“捔”,二是“■”“■”讹作“檥”“蚁(蟻)”,三是“滓”讹作“泽(澤)”。 展开更多
关键词 形近讹误 训诂 词义
原文传递
论王念孙父子治《诗》方法及现代影响
19
作者 蔺文龙 《通化师范学院学报》 2014年第5期75-79,共5页
高邮王氏父子是清代著名的考据学大家,在清代《诗经》学史上占据十分重要的地位。王氏父子《诗》学成就得益于其家学传统、个人的勤奋努力以及同代学者的相互鼓励。他们以博采群书、融会贯通的治学精神,通过因声求义、归纳通例、以三家... 高邮王氏父子是清代著名的考据学大家,在清代《诗经》学史上占据十分重要的地位。王氏父子《诗》学成就得益于其家学传统、个人的勤奋努力以及同代学者的相互鼓励。他们以博采群书、融会贯通的治学精神,通过因声求义、归纳通例、以三家诗考证文字的治学方法,取得超越前人的巨大成就,并对现代《诗经》学研究产生了巨大而深远的影响。 展开更多
关键词 王念孙 王引之 因声求义 治《诗》特点 《诗经》考据学
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部