期刊文献+
共找到71篇文章
< 1 2 4 >
每页显示 20 50 100
从单纯表量到多元化表意——试论汉语历时发展中的“数量名”结构 被引量:5
1
作者 盛林 《山东大学学报(哲学社会科学版)》 北大核心 2004年第1期94-98,共5页
"数量名"结构是汉语中最典型的表量短语结构。但在长期的语言发展过程中,在汉语特殊的语音形式和组织特点的条件下,这一结构形式的语义从初始的单纯表量走向了表意的多元化,其结构的内部关系也复杂多样起来,现已成为汉语中一... "数量名"结构是汉语中最典型的表量短语结构。但在长期的语言发展过程中,在汉语特殊的语音形式和组织特点的条件下,这一结构形式的语义从初始的单纯表量走向了表意的多元化,其结构的内部关系也复杂多样起来,现已成为汉语中一种多功能的常规性句法结构。 展开更多
关键词 量词 计量单位 表量短语 “数量名”结构
下载PDF
基于子字单元的维吾尔语语音识别研究 被引量:5
2
作者 薛化建 董兴华 +2 位作者 周喜 吐尔洪.吾司曼 李晓 《计算机工程》 CAS CSCD 北大核心 2011年第20期208-210,共3页
为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个... 为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。 展开更多
关键词 维吾尔语 词切分 子字单元 隐马尔科夫模型 连续语音识别
下载PDF
汉语日月概念的称名策略与语义关联
3
作者 程珊珊 《语言学论丛》 CSSCI 2024年第1期146-160,共15页
本文主要从称名视角出发,通过汉语中的多义单纯词和合成词展现了围绕着|日|和|月|的概念关系。我们发现单纯词|月|缺乏其他的概念来源,而以合成词表达的|月|有较为丰富的源概念,除闽语(拟人突显)外大部分方言呈现出光照突显的特点;由单... 本文主要从称名视角出发,通过汉语中的多义单纯词和合成词展现了围绕着|日|和|月|的概念关系。我们发现单纯词|月|缺乏其他的概念来源,而以合成词表达的|月|有较为丰富的源概念,除闽语(拟人突显)外大部分方言呈现出光照突显的特点;由单纯词表达的|日|的源概念具有光热突显的特点,而合成词表达的|日|的概念来源呈现出更显著的方言差异。单纯词和合成词呈现的概念关联共同证明,语素/词的替换可能会导致语义引申方向发生变化,普遍概念关联只是为语义演变提供可能路径,实际演变方向由语素自身的语义结构决定。因此关于概念关系的研究有必要对已有的基于同词化的概念网络进行扩展,应更多地关注语素层面的多义性,并将概念的不同称名机制整合进概念关联的网络,以更好地解释词汇变化的理据性。 展开更多
关键词 认知称名 方言差异 日月 构词方式 多义性单位 语义演变
原文传递
谈谈“们”的语法单位归属问题 被引量:4
4
作者 徐连祥 《汉语学习》 CSSCI 北大核心 2011年第6期47-53,共7页
关于"们"的语法单位归属问题,学界多有分歧,这给现代汉语的词汇及语法教学带来诸多不便。本文从分歧的现象及原因入手,通过对词缀、助词语法特征的对比,以及对"们"在实际应用中的语法特征的分析和阐释,论证"们... 关于"们"的语法单位归属问题,学界多有分歧,这给现代汉语的词汇及语法教学带来诸多不便。本文从分歧的现象及原因入手,通过对词缀、助词语法特征的对比,以及对"们"在实际应用中的语法特征的分析和阐释,论证"们"所应归属的语法单位是助词。 展开更多
关键词 助词 词缀 语法单位
下载PDF
普通话测试中“字化”现象调查分析 被引量:3
5
作者 贺虎 《青海师专学报》 2008年第3期34-37,共4页
普通话学习不仅要求语音清晰、准确,而且要求发音者语言流畅自然,从而达到高层次的交际效果。但是,一些普通话学习者尤其是少数民族大学生,由于受学习环境,自身心理因素、教育背景等的影响,在语言表达上出现了"字化"现象。本... 普通话学习不仅要求语音清晰、准确,而且要求发音者语言流畅自然,从而达到高层次的交际效果。但是,一些普通话学习者尤其是少数民族大学生,由于受学习环境,自身心理因素、教育背景等的影响,在语言表达上出现了"字化"现象。本文在少数民族大学生普通话测试者中作了一个抽样调查,试图分析这种"字化"现象的表现及其形成原因。 展开更多
关键词 普通话 测试 字化 现象
下载PDF
语言学的“字”与文字学的“字” 被引量:1
6
作者 连登岗 《南通大学学报(社会科学版)》 2006年第1期77-82,共6页
“字”这个术语承担着不同的概念。在文字学中,“字”分别指:1、形音义三要素或者形音二要素相统一的符号。2、字的形体,也就是在形音义三要素的字中,视觉能够感知的部分。3、指可以用来记载语言的音义但尚未与语言的音义结合的图形符... “字”这个术语承担着不同的概念。在文字学中,“字”分别指:1、形音义三要素或者形音二要素相统一的符号。2、字的形体,也就是在形音义三要素的字中,视觉能够感知的部分。3、指可以用来记载语言的音义但尚未与语言的音义结合的图形符号。在语言学中,“字”分别指:1、单纯的语音音节。2、口语中的语言单位。3、即书面语中用视觉图形符号所表示的语言单位。综合起来看,文字是视觉图形符号与语言符号结合的产物,因而字既是文字的用字基本单位,也是书面语言的基本单位。 展开更多
关键词 术语 概念 语言 文字 单位
下载PDF
融合领域多词特征的英文武器装备名识别研究 被引量:1
7
作者 雷树杰 邢富坤 王闻慧 《计算机应用与软件》 北大核心 2019年第6期177-183,195,共8页
武器装备名是军事领域中一类重要的命名实体,英文武器装备名的自动识别对于军事领域的信息处理有着重要的价值。作为一种融合了上下文特征的统计模型,条件随机场(conditional random field,CRF)在对命名实体的识别中有着广泛的应用。针... 武器装备名是军事领域中一类重要的命名实体,英文武器装备名的自动识别对于军事领域的信息处理有着重要的价值。作为一种融合了上下文特征的统计模型,条件随机场(conditional random field,CRF)在对命名实体的识别中有着广泛的应用。针对武器装备名的构造特点及CRF模型在使用语言特征上存在的不足,对已有CRF模型提出两点改进:丰富模型使用的特征,对武器装备名的构造模式与要素进行分析总结,形成针对武器装备名的要素类,并将该类别信息作为特征提供给CRF模型使用;针对构成武器装备名的要素大多是多词单位,将标注单元由词扩展到多词组合。实验结果显示,改进后模型对武器装备名识别的准确率和召回率均有明显提升,准确率由85.62%提升为90.60%,召回率由42.27%提升为88.17%。该方法不仅对于军事领域相关的信息处理任务有着重要价值,并且对于其他语种和相关领域的研究都有着重要的借鉴意义。 展开更多
关键词 英文武器装备名 CRF 构造规律 多词单元 自动识别
下载PDF
Text Understanding with a Hybrid Neural Network Based Learning
8
作者 Shen Gao Huaping Zhang Kai Gao 《国际计算机前沿大会会议论文集》 2017年第2期26-28,共3页
Teaching machine to understand needs to design an algorithm for the machine to comprehend documents. As some traditional methods cannot learn the inherent characters effectively, this paper presents a new hybrid neura... Teaching machine to understand needs to design an algorithm for the machine to comprehend documents. As some traditional methods cannot learn the inherent characters effectively, this paper presents a new hybrid neural network model to extract sentence-level summarization from single document,and it allows us to develop an attention based deep neural network that can learn to understand documents with minimal prior knowledge. The proposed model composed of multiple processing layers can learn the representations of features.Word embedding is used to learn continuous word representations for constructing sentence as input to convolutional neural network. The recurrent neural network is also used to label the sentences from the original document, and the proposed BAM-GRU model is more efficient. Experimental results show the feasibility of the approach. Some problems and further works are also present in the end. 展开更多
关键词 Deep LEARNING Convolutional NEURAL NETWORK RECURRENT NEURAL NETWORK word EMBEDDING GATED RECURRENT unit
下载PDF
A new method for extracting domain terminology
9
作者 裴炳镇 陈笑蓉 +1 位作者 胡熠 陆汝占 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2009年第2期289-296,共8页
This article proposes a new general, highly efficient algorithm for extracting domain terminologies. This domain-independent algorithm with multi-layers of filters is a hybrid of statistic-oriented and rule-oriented m... This article proposes a new general, highly efficient algorithm for extracting domain terminologies. This domain-independent algorithm with multi-layers of filters is a hybrid of statistic-oriented and rule-oriented methods. Utilizing the features of domain terminologies and the characteristics that are unique to Chinese, this algorithm extracts domain terminologies by generating multi-word unit (MWU) candidates at first and then fihering the candidates through multi-strategies. Our test resuhs show that this algorithm is feasible and effective. 展开更多
关键词 domain terminology multi-word unit (MWU) automatic extract filter
下载PDF
术语轮排索引的学科覆盖优势与局限性
10
作者 陶原珂 《术语标准化与信息技术》 2005年第2期16-20,共5页
术语轮排索引的应用,主要取决于两个因素:一是术语所属语言的词汇结构特点;一是所要检索学科术语的特点。前一个因素决定术语以词素为形式单位参与轮排索引系统,还是以词为形式单位参与轮排索引系统。后一个因素要求,需要索引的学科中... 术语轮排索引的应用,主要取决于两个因素:一是术语所属语言的词汇结构特点;一是所要检索学科术语的特点。前一个因素决定术语以词素为形式单位参与轮排索引系统,还是以词为形式单位参与轮排索引系统。后一个因素要求,需要索引的学科中大部分术语由两个或两个以上索引形式构成。由于术语发展中存在着经济的原则,古老学科的术语大多数以单个词的形式构成,而现代学科的术语以两个或两个以上的词(或词素)形式构成,因此,轮排索引对现代学科术语的检索更有应用价值。 展开更多
关键词 局限性 优势 覆盖 形式构成 学科术语 索引系统 结构特点 应用价值 检索 单位 词素 现代
下载PDF
论词的构成、结构和地位 被引量:22
11
作者 周荐 《中国语文》 CSSCI 北大核心 2003年第2期148-155,共8页
单字在汉语史上曾经是最重要的甚至是惟一的词汇单位。中古以降,大量的单字与单字相组合构成合成词,体现了单字无与伦比的构词功能。在由单字构成的合成性的词汇单位中,单字间的关系纷繁复杂,既有句法层面上的问题,也有词法层面上的问题... 单字在汉语史上曾经是最重要的甚至是惟一的词汇单位。中古以降,大量的单字与单字相组合构成合成词,体现了单字无与伦比的构词功能。在由单字构成的合成性的词汇单位中,单字间的关系纷繁复杂,既有句法层面上的问题,也有词法层面上的问题,其中在词法的层面上以意合的方式构成的合成词占有相当大的比重。无论基于哪种层面构成的合成性的单位,只要它具备了词的属性就应该承认其词汇单位的资格。合成词当然是汉语中的一类词汇单位,而且,相比单字(虚字和实字)、联绵词和成语,它是更为重要的一类词汇单位。 展开更多
关键词 复字词 句法模式 意合词 容受性 词汇单位 汉语 单字 构成 结构 语法地位 句法 词法 合成词 联绵词 成语
原文传递
离合词的价值及处理方式——兼评词类研究的方法 被引量:10
12
作者 梁驰华 《广西师院学报(哲学社会科学版)》 2000年第4期81-84,共4页
汉语中离合词的存在有其必然的价值 :从离合词产生的角度来看 ,一是离合词适应了汉语表意的精确性和多样化的要求 ;二是离合词能唤起听者的注意 ,适应语言交际的需要 ;至于离合词的处理方式可根据不同的需要区分为两个不同的层次———... 汉语中离合词的存在有其必然的价值 :从离合词产生的角度来看 ,一是离合词适应了汉语表意的精确性和多样化的要求 ;二是离合词能唤起听者的注意 ,适应语言交际的需要 ;至于离合词的处理方式可根据不同的需要区分为两个不同的层次———从学术层面 ,处理作词———词组单位 ;从教学层面 。 展开更多
关键词 适应 多样化 词组 处理方式 学术 要求 教学 价值 层面 单位
下载PDF
英语考试翻译自动评分中双语对齐技术的应用 被引量:23
13
作者 文秋芳 秦颖 江进林 《外语电化教学》 CSSCI 2009年第1期3-8,共6页
翻译自动评分是语言测试和计算机技术相结合的研究热点之一。本文提出了将自然语言处理中的双语对齐技术,包括词语对齐、多词单位对齐等用于翻译自动评分系统的方法,分析了未对齐词和多词单位在译文中的各种情况。实验用训练语料来自... 翻译自动评分是语言测试和计算机技术相结合的研究热点之一。本文提出了将自然语言处理中的双语对齐技术,包括词语对齐、多词单位对齐等用于翻译自动评分系统的方法,分析了未对齐词和多词单位在译文中的各种情况。实验用训练语料来自学生真实译文,并由专家进行人工评分。结果表明:对齐的数目和翻译得分显著相关,双语对齐数可以作为多元回归构建的翻译评分模型中一项重要的参数。最后讨论了影响对齐数目和得分相关性的因素。 展开更多
关键词 自动翻译评分 词对齐 多词单位对齐 双语对齐
原文传递
基于门循环单元神经网络的中文分词法 被引量:22
14
作者 李雪莲 段鸿 许牧 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第2期237-243,共7页
目前,学术界主流的中文分词法是基于字符序列标注的传统机器学习方法,该方法存在需要人工定义特征、特征稀疏等问题.随着深度学习的研究和应用的兴起,研究者提出了将长短时记忆(long short-term memory,LSTM)神经网络应用于中文分词任... 目前,学术界主流的中文分词法是基于字符序列标注的传统机器学习方法,该方法存在需要人工定义特征、特征稀疏等问题.随着深度学习的研究和应用的兴起,研究者提出了将长短时记忆(long short-term memory,LSTM)神经网络应用于中文分词任务的方法,该方法可以自动学习特征,并有效建模长距离依赖信息,但是该模型较为复杂,存在模型训练和预测时间长的缺陷.针对该问题,提出了基于门循环单元(gated recurrent unit,GRU)神经网络的中文分词法,该方法继承了LSTM模型可自动学习特征、能有效建立长距离依赖信息的优点,具有与基于LSTM神经网络中文分词法相当的性能,并在速度上有显著提升. 展开更多
关键词 自然语言处理 中文分词 门循环单元 字嵌入 循环神经网络
下载PDF
基于语料库和网络的新词自动识别 被引量:11
15
作者 刘建舟 何婷婷 骆昌日 《计算机应用》 CSCD 北大核心 2004年第7期132-134,共3页
汉语自动分词是进行中文信息处理的基础。目前 ,困扰汉语自动分词的一个主要难题就是新词自动识别 ,尤其是非专名新词的自动识别。同时 ,新词自动识别对于汉语词典的编纂也有着极为重要的意义。文中提出了一种新的新词自动识别的方法。... 汉语自动分词是进行中文信息处理的基础。目前 ,困扰汉语自动分词的一个主要难题就是新词自动识别 ,尤其是非专名新词的自动识别。同时 ,新词自动识别对于汉语词典的编纂也有着极为重要的意义。文中提出了一种新的新词自动识别的方法。这个方法用到了互信息和log likelihoodratio两个参数的改进形式。主要分三个阶段完成 :先从网络上下载丰富的语料 ,构建语料库 ;然后采用统计的方法进行多字词识别 ;最后与已有的词表进行对照 ,判定新词。 展开更多
关键词 抽取多字词 页面解析 动态语料库
下载PDF
CNN-BiGRU模型在中文短文本情感分析的应用 被引量:17
16
作者 缪亚林 姬怡纯 +2 位作者 张顺 程文芳 彭二楼 《情报科学》 CSSCI 北大核心 2021年第4期85-91,共7页
【目的/意义】改善传统情感分析方法工作量大,以及研究者采用深度学习方法多数仅致力于提高分析准确率,往往忽略网络训练速度的问题。【方法/过程】提出将卷积神经网络(CNN)与双向门控循环单元(GRU)相结合的文本情感分析模型(CNN-BiGRU)... 【目的/意义】改善传统情感分析方法工作量大,以及研究者采用深度学习方法多数仅致力于提高分析准确率,往往忽略网络训练速度的问题。【方法/过程】提出将卷积神经网络(CNN)与双向门控循环单元(GRU)相结合的文本情感分析模型(CNN-BiGRU),通过CNN和双向GRU对文本的局部静态特征以及序列特征进行提取,后接单向GRU层对其进行进一步降维,最后使用Sigmoid进行情感分类。【结果/结论】通过自建豆瓣影视评论数据集,将本模型与同复杂度的CNN-BLSTM模型相比,分类准确率和训练速率分别提高了2.52%、41.43%。【创新/局限】提出CNN-BiGRU网络应用于短文本情感分析,简化特征提取过程,引入上下文语义信息,减少参数提高效率。 展开更多
关键词 情感分析 词向量 卷积神经网络 双向门控循环单元 上下文语义信息
原文传递
用于短文本分类的DC-BiGRU_CNN模型 被引量:17
17
作者 郑诚 薛满意 +1 位作者 洪彤彤 宋飞豹 《计算机科学》 CSCD 北大核心 2019年第11期186-192,共7页
文本分类是自然语言处理中一项比较基础的任务,如今深度学习技术被广泛用于处理文本分类任务。在处理文本序列时,卷积神经网络可以提取局部特征,循环神经网络可以提取全局特征,它们都表现出了不错的效果。但是,卷积神经网络不能很好地... 文本分类是自然语言处理中一项比较基础的任务,如今深度学习技术被广泛用于处理文本分类任务。在处理文本序列时,卷积神经网络可以提取局部特征,循环神经网络可以提取全局特征,它们都表现出了不错的效果。但是,卷积神经网络不能很好地捕获文本的上下文相关语义信息,循环神经网路对语义的关键信息不敏感。另外,利用更深层次的网络虽然可以更好地提取特征,但是容易产生梯度消失或梯度爆炸问题。针对以上问题,文中提出了一种基于密集连接循环门控单元卷积网络的混合模型(DC-BiGRU_CNN)。该模型首先用一个标准的卷积神经网络训练出字符级词向量,然后将其与词级词向量进行拼接并作为网络输入层。受密集连接卷积网络的启发,在对文本进行高级语义建模阶段时,采用文中提出的密集连接双向门控循环单元,其可以弥补梯度消失或梯度爆炸的缺陷,并且加强了每一层特征之间的传递,实现了特征复用;对前面提取的深层高级语义表示进行卷积和池化操作以获得最终的语义特征表示,再将其输入到softmax层,实现对文本的分类。在多个公开数据集上的研究结果表明,DC-BiGRU_CNN模型在执行文本分类任务时准确率有显著提升。此外,通过实验分析了模型的不同部件对性能提升的作用,研究了句子的最大长度值、网络的层数、卷积核的大小等参数对模型效果的影响。 展开更多
关键词 字符级词向量 双向门控循环单元 密集连接 卷积神经网络 文本分类
下载PDF
信息处理用藏文分词单位研究 被引量:13
18
作者 关白 《中文信息学报》 CSCD 北大核心 2010年第3期124-128,共5页
分词单位作为分词系统的基本单位,是研究分词理论的基础,要确立分词单位就必须有相应的理论体系。该文结合藏文已有的语法著作和汉语语义分类体系建立与分词单位相应的词类划分体系;参照《资讯处理用中文分词规范》和《信息处理用现代... 分词单位作为分词系统的基本单位,是研究分词理论的基础,要确立分词单位就必须有相应的理论体系。该文结合藏文已有的语法著作和汉语语义分类体系建立与分词单位相应的词类划分体系;参照《资讯处理用中文分词规范》和《信息处理用现代汉语分词规范》等标准,从藏文文本语料出发,建立切分分词单位的九项基本原则和三项辅助原则,以此词类划分体系和切分原则为理论依据对藏文的分词单位进行详细说明。 展开更多
关键词 计算机应用 中文信息处理 藏文分词 分词单位 信息处理 分词原则
下载PDF
基于CNN⁃BiGRU模型的事件触发词抽取方法 被引量:13
19
作者 苗佳 段跃兴 +1 位作者 张月琴 张泽华 《计算机工程》 CAS CSCD 北大核心 2021年第9期69-74,83,共7页
传统事件触发词抽取方法在特征提取过程中对自然语言处理工具产生过度依赖的方法,耗费大量人力,容易出现错误传播和数据稀疏性等问题。为此,提出采用CNN-BiGRU模型进行事件触发词抽取的方法。将词向量和位置向量进行拼接作为输入,提取... 传统事件触发词抽取方法在特征提取过程中对自然语言处理工具产生过度依赖的方法,耗费大量人力,容易出现错误传播和数据稀疏性等问题。为此,提出采用CNN-BiGRU模型进行事件触发词抽取的方法。将词向量和位置向量进行拼接作为输入,提取词级别特征和句子全局特征,提高触发词抽取效果,并通过CNN提取词汇级别特征,利用BiGRU获取文本上下文语义信息。在ACE2005英文语料库和中文突发事件语料库CEC上的实验结果表明,该模型事件触发词识别F1值分别达到74.9%和79.29%,有效提升事件触发词的抽取性能。 展开更多
关键词 事件抽取 触发词检测 事件类型识别 卷积神经网络 循环神经网络 双向门控循环单元 特征提取
下载PDF
太阳跟踪自动化控制系统设计 被引量:12
20
作者 王东江 刘亚军 《数字技术与应用》 2010年第7期19-26,共8页
随着太阳能不断被人类发现利用,如何应用自动控制系统有效捕捉太阳能更是当前自动化业界所面临的最新课题,本次设计就是利用自动控制技术实现了对太阳能的最大化合理应用。本系统阐述了自动化控制系统的设计过程以及软硬件部分的设计,... 随着太阳能不断被人类发现利用,如何应用自动控制系统有效捕捉太阳能更是当前自动化业界所面临的最新课题,本次设计就是利用自动控制技术实现了对太阳能的最大化合理应用。本系统阐述了自动化控制系统的设计过程以及软硬件部分的设计,系统采用AT89S52单片机作为整个系统的控制核心,系统采用了两种追踪模式:光电检测追踪模式和太阳角度追踪模式。晴天时系统采用光电检测追踪模式,而阴天时系统进入太阳角度追踪模式。在光电检测追踪模式下,光电检测部分采用光电二极管作为光电传感器,利用硬件装置通过光电二极管的比较电路来判断太阳的方位,从而达到了追踪太阳的目的。在太阳角度追踪模式下,要是通过软件计算当时当地太阳高度角和太阳方位角,再配合硬件来实现对太阳的追踪。系统的软件和硬件采用模块化设计思想,完成了系统的制作。 展开更多
关键词 太阳能 自动化控制 追踪系统 光电检测 太阳角度 单片机
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部