期刊文献+
共找到104篇文章
< 1 2 6 >
每页显示 20 50 100
基于矩阵约束法的中文分词研究 被引量:11
1
作者 张素智 刘放美 《计算机工程》 CAS CSCD 北大核心 2007年第15期98-100,共3页
分词识别和歧义消除是影响信息检索系统准确度的重要因素,该文提出了一种基于语法和语义的使用约束矩阵的中文分词算法。该算法建立在语法和句法的基础上,从语境角度分析歧义字段,提高分词准确率。系统可以将输入的连续汉字串进行分词处... 分词识别和歧义消除是影响信息检索系统准确度的重要因素,该文提出了一种基于语法和语义的使用约束矩阵的中文分词算法。该算法建立在语法和句法的基础上,从语境角度分析歧义字段,提高分词准确率。系统可以将输入的连续汉字串进行分词处理,输出分割后的汉语词串,并得到一个词典。再用《现代汉语语法信息词典》进行处理,实验结果显示分词准确率能提高10%左右。 展开更多
关键词 中文分词 矩阵约束 歧义消除 分词系统
下载PDF
基于增强问题重要性表示的答案选择算法研究 被引量:3
2
作者 谢正文 柏钧献 +1 位作者 熊熙 琚生根 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第1期66-72,共7页
针对经典的文本匹配模型在问答系统中应用的缺陷和不足,提出了一种基于增强问题重要性表示网络BIWN的答案选择算法.目前,现有的答案选择模型普遍将问题句子和答案句子直接进行匹配,忽略了问题句子和答案句子中的噪声词对匹配的影响.针... 针对经典的文本匹配模型在问答系统中应用的缺陷和不足,提出了一种基于增强问题重要性表示网络BIWN的答案选择算法.目前,现有的答案选择模型普遍将问题句子和答案句子直接进行匹配,忽略了问题句子和答案句子中的噪声词对匹配的影响.针对这个问题,首先,利用自注意力机制修改问题句子中各个词的权重,生成“干净”的问题句子向量;然后,利用词级交互矩阵捕捉问题句子和答案句子之间的细粒度语义信息,从而有效地弱化了噪声词对正确答案的影响;最后,利用多窗口CNN提取特征信息得到预测结果.基准数据集上的对比实验表明,BIWN模型在答案选择任务的性能优于主流的答案选择算法,MAP值和MRR值提升了约0.7%~6.1%. 展开更多
关键词 答案选择 问题表示 自注意力机制 词级矩阵
下载PDF
基于移位和异或的最佳扩散变换的构造 被引量:3
3
作者 曹云飞 刘瑶 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第5期1019-1023,共5页
扩散结构的好坏直接影响了分组密码的扩散速度和安全强度,以分支数尽可能大的线性变换为分组密码算法的扩散结构是设计分组密码的一种重要方法,线性变换的构造可通过可逆矩阵的构造完成.利用高效的算法搜索出几类可逆广义字变换,在此基... 扩散结构的好坏直接影响了分组密码的扩散速度和安全强度,以分支数尽可能大的线性变换为分组密码算法的扩散结构是设计分组密码的一种重要方法,线性变换的构造可通过可逆矩阵的构造完成.利用高效的算法搜索出几类可逆广义字变换,在此基础上提出一类计算上可行的基于GF(2^(32))上移位和比特异或的最佳扩散变换构造的算法.该变换特别适合硬件实现,广泛用于分组、序列以及HASH等密码算法的设计中. 展开更多
关键词 MDS 广义字 变换矩阵
原文传递
A Fast Recognition System for Isolated Printed Characters Using Center of Gravity and Principal Axis 被引量:1
4
作者 Ahmed M. Shaffie Galal A. Elkobrosy 《Applied Mathematics》 2013年第9期1313-1319,共7页
The purpose of this paper is to propose a new multi stage algorithm for the recognition of isolated characters. It was similar work done before using only the center of gravity (This paper is extended version of “A f... The purpose of this paper is to propose a new multi stage algorithm for the recognition of isolated characters. It was similar work done before using only the center of gravity (This paper is extended version of “A fast recognition system for isolated printed characters using center of gravity”, LAP LAMBERT Academic Publishing 2011, ISBN: 978-38465-0002-6), but here we add using principal axis in order to make the algorithm rotation invariant. In my previous work which is published in LAP LAMBERT, I face a big problem that when the character is rotated I can’t recognize the character. So this adds constrain on the document to be well oriented but here I use the principal axis in order to unify the orientation of the character set and the characters in the scanned document. The algorithm can be applied for any isolated character such as Latin, Chinese, Japanese, and Arabic characters but it has been applied in this paper for Arabic characters. The approach uses normalized and isolated characters of the same size and extracts an image signature based on the center of gravity of the character after making the character principal axis vertical, and then the system compares these values to a set of signatures for typical characters of the set. The system then provides the closeness of match to all other characters in the set. 展开更多
关键词 OCR Pattern Recognition CONFUSION matrix Image SIGNATURE word Segmentation CHARACTER FRAGMENTATION
下载PDF
基于关键词学习的文本分类方法 被引量:2
5
作者 王天时 张龙 +2 位作者 刘怀泉 刘丽 陈思琦 《山东师范大学学报(自然科学版)》 CAS 2019年第1期54-60,共7页
提出一种基于关键词学习的文本分类方法.采用LDA主题模型抽取文本的关键词,通过关键词的词袋构造文本的特征矩阵并进行PCA降维,将低阶特征矩阵输入由卷积神经网络和BP神经网络的混合网络中对文本分类进行学习.为提高文本分类效果,引入... 提出一种基于关键词学习的文本分类方法.采用LDA主题模型抽取文本的关键词,通过关键词的词袋构造文本的特征矩阵并进行PCA降维,将低阶特征矩阵输入由卷积神经网络和BP神经网络的混合网络中对文本分类进行学习.为提高文本分类效果,引入与BP神经网络同构的深度神经网络对BP神经网络的初始权值进行初始化.在多数据集上的实验表明,本文方法明显提高文本分类的准确率. 展开更多
关键词 抽取 词袋 特征矩阵 卷积神经网络 BP神经网络
下载PDF
计算机对文章意义段划分的研究 被引量:1
6
作者 刘美茹 《计算机工程》 CAS CSCD 北大核心 2007年第13期205-206,共2页
文章意义段的自动划分技术是自然语言理解研究领域中的一个非常重要的研究课题。该文在对文章意义段划分进行研究与实践的基础上,提出了由计算机自动划分意义段的数学模型。通过计算文本中用词重复数,建立用词重复频率三角矩阵,给出了... 文章意义段的自动划分技术是自然语言理解研究领域中的一个非常重要的研究课题。该文在对文章意义段划分进行研究与实践的基础上,提出了由计算机自动划分意义段的数学模型。通过计算文本中用词重复数,建立用词重复频率三角矩阵,给出了各个自然段归并成意义段的制约条件。实践证明,该数学模型反映了一类文章的客观结构。 展开更多
关键词 意义段 词频 三角矩阵
下载PDF
基于点关联测度矩阵分解的中英跨语言词嵌入方法 被引量:2
7
作者 于东 赵艳 +1 位作者 韦林煊 荀恩东 《中文信息学报》 CSCD 北大核心 2017年第1期58-65,74,共9页
研究基于矩阵分解的词嵌入方法,提出统一的描述模型,并应用于中英跨语言词嵌入问题。以双语对齐语料为知识源,提出跨语言关联词计算方法和两种点关联测度的计算方法:跨语言共现计数和跨语言点互信息。分别设计目标函数学习中英跨语言词... 研究基于矩阵分解的词嵌入方法,提出统一的描述模型,并应用于中英跨语言词嵌入问题。以双语对齐语料为知识源,提出跨语言关联词计算方法和两种点关联测度的计算方法:跨语言共现计数和跨语言点互信息。分别设计目标函数学习中英跨语言词嵌入。从目标函数、语料数据、向量维数等角度进行实验,结果表明,在中英跨语言文档分类中以前者作为点关联测度最高得到87.04%的准确率;在中英跨语言词义相似度计算中,后者作为点关联测度得到更好的性能,同时在英—英词义相似度计算中的性能略高于主流的英语词嵌入。 展开更多
关键词 点关联测度 词嵌入 跨语言 矩阵分解
下载PDF
MIMIC数据库研究现状与热点分析 被引量:1
8
作者 张心怡 张六一 《医学信息》 2022年第1期19-23,共5页
目的检索MIMIC数据库研究的相关文献,分析当前研究现状与热点。方法在PubMed数据库中下载2010年1月-2020年12月有关MIMIC数据库的相关文献题录,分析文献的发表年份、来源期刊及期刊所属国家、第一作者;使用BICOMB 2.0统计主要主题词出... 目的检索MIMIC数据库研究的相关文献,分析当前研究现状与热点。方法在PubMed数据库中下载2010年1月-2020年12月有关MIMIC数据库的相关文献题录,分析文献的发表年份、来源期刊及期刊所属国家、第一作者;使用BICOMB 2.0统计主要主题词出现的频次,截取频次≥4次的高频主要主题词形成词篇矩阵,运用SPSS 22.0进行系统聚类分析。结果关于MIMIC数据库的发文量共334篇,共有91种期刊发表了相关文献,期刊来源国家排名前3的是美国、英国、荷兰;第一作者主要分布在美国和加拿大;高频主题词有30个,通过共词聚类分析获得6个研究热点:MIMIC数据库介绍或数据处理方法的研究,ICU患者预后、死亡率预测分析,对ICU患者基本生命体征、护理信息的研究,探究某些因素是否是某些疾病的影响因子,范围较广的其他类研究,预测某种疾病的发病率或死亡率。结论基于MIMIC数据库已经开展了很多项临床数据挖掘研究,针对护理病程记录、护理相关信息的研究还较少,今后可根据护理领域数据开展更多研究。借鉴MIMIC数据库运行机制构建符合我国患者的临床医学数据集,可有效辅助临床决策。 展开更多
关键词 MIMIC数据库 主题词 研究热点 词篇矩阵
下载PDF
Efficient matrix inversion based on VLIW architecture
9
作者 Li Zhang Fu Li Guangming Shi 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2014年第3期393-398,共6页
Matrix inversion is a critical part in communication, signal processing and electromagnetic system. A flexible and scalable very long instruction word (VLIW) processor with clustered architecture is proposed for mat... Matrix inversion is a critical part in communication, signal processing and electromagnetic system. A flexible and scalable very long instruction word (VLIW) processor with clustered architecture is proposed for matrix inversion. A global register file (RF) is used to connect al the clusters. Two nearby clusters share a local register file. The instruction sets are also designed for the VLIW processor. Experimental results show that the proposed VLIW architecture takes only 45 latency to invert a 4 × 4 matrix when running at 150 MHz. The proposed design is roughly five times faster than the DSP solution in processing speed. 展开更多
关键词 matrix inversion very long instruction word (VLIW) latency register file (RF) cluster.
下载PDF
MDS一种新构造方法 被引量:1
10
作者 谢海英 曹云飞 《通信技术》 2007年第11期300-301,399,共3页
文中给出了广义字变换和变换矩阵的概念,研究了变换矩阵的性质,得出了一种新的MDS(Maximum Distance Separable)矩阵构造方法,并在此基础上给出了一种4×4规模的MDS变换矩阵。
关键词 MDS矩阵 广义字 变换矩阵
原文传递
融合语义信息的矩阵分解词向量学习模型 被引量:1
11
作者 陈培 景丽萍 《智能系统学报》 CSCD 北大核心 2017年第5期661-667,共7页
词向量在自然语言处理中起着重要的作用,近年来受到越来越多研究者的关注。然而,传统词向量学习方法往往依赖于大量未经标注的文本语料库,却忽略了单词的语义信息如单词间的语义关系。为了充分利用已有领域知识库(包含丰富的词语义信息)... 词向量在自然语言处理中起着重要的作用,近年来受到越来越多研究者的关注。然而,传统词向量学习方法往往依赖于大量未经标注的文本语料库,却忽略了单词的语义信息如单词间的语义关系。为了充分利用已有领域知识库(包含丰富的词语义信息),文中提出一种融合语义信息的词向量学习方法(KbEMF),该方法在矩阵分解学习词向量的模型上加入领域知识约束项,使得拥有强语义关系的词对获得的词向量相对近似。在实际数据上进行的单词类比推理任务和单词相似度量任务结果表明,KbEMF比已有模型具有明显的性能提升。 展开更多
关键词 自然语言处理 词向量 矩阵分解 语义信息 知识库
下载PDF
基于中心化相似度矩阵的词向量方法 被引量:1
12
作者 徐帆 王裴岩 蔡东风 《计算机应用研究》 CSCD 北大核心 2019年第2期411-414,434,共5页
对基于矩阵分解的词向量方法进行了研究,发现降维前相似度矩阵质量与词向量质量存在线性相关性,提出了一种基于中心化相似度矩阵的方法。该方法使得相似(不相似或弱相似)词间的相似程度相对增强(减弱)。在WS-353和RW数据集的词语相似性... 对基于矩阵分解的词向量方法进行了研究,发现降维前相似度矩阵质量与词向量质量存在线性相关性,提出了一种基于中心化相似度矩阵的方法。该方法使得相似(不相似或弱相似)词间的相似程度相对增强(减弱)。在WS-353和RW数据集的词语相似性实验中验证了所提出方法的有效性,两个数据集下词向量质量最高提升0. 289 6和0. 180 1。中心化能够提升降维前相似度矩阵质量,进而提升词向量质量。 展开更多
关键词 词向量 中心化 相似度矩阵
下载PDF
西文环境下的汉字显示
13
作者 李为民 王海涛 《河北工学院学报》 1994年第1期70-74,共5页
提出了在西文各种屏幕方式下显示汉字的方法,图形方式下采用逐点描绘法,文本方式下用字符表点阵修改法.笔者将此方法用于软件开发,效果极佳.
关键词 屏幕方式 点阵 汉字显示 西文环境
下载PDF
基于文本卷积的多因素煤炭产品推荐模型
14
作者 潘理虎 郝彦杰 +1 位作者 周耀辉 龚大立 《计算机技术与发展》 2021年第4期198-203,共6页
为了向需求维度不同的买家科学地提供基于煤炭产品自身品质及其发售地区差异性推荐意见,文中提出了一种基于卷积神经网络与自然语言处理相结合的文本卷积推荐模型(text CNN recommendation model,TCRM)。该模型由各字段单词特征生成嵌... 为了向需求维度不同的买家科学地提供基于煤炭产品自身品质及其发售地区差异性推荐意见,文中提出了一种基于卷积神经网络与自然语言处理相结合的文本卷积推荐模型(text CNN recommendation model,TCRM)。该模型由各字段单词特征生成嵌入向量,在不同尺寸的卷积核上做卷积和最大池化,再通过全连接层合并所有特征分别得出用户及煤炭产品特征矩阵,将用户特征和煤炭产品特征作为输入,经过全连接的方式进行计算以产生评分预测值。在特征矩阵维数为32,经过20次迭代后模型损失固定在1.0附近,准确率维持在0.25左右,在模型损失率及健壮性上均优于传统数值比例特征运算计算评分时的模型。这样的推荐方式改善了以往由于单因素评分而带来的近邻相似度计算不准确和矩阵稀疏导致的推荐结果不理想的情况。在大量真实数据集上的实验结果显示,在此算法基础上的深层次煤炭产品推荐具有良好的效果。 展开更多
关键词 自然语言处理 词嵌入 文本卷积 特征矩阵 评分预测
下载PDF
用计算机对文章意义段划分初探
15
作者 刘美茹 吴岩 +2 位作者 刘挺 王开铸 于明光 《东北测绘》 1997年第4期23-24,共2页
本文首次提出由计算机自动划分意义段的数学模型。通过计算文中用词重复数,然后建立用词重复频率三角矩阵,最后给出各自然段归并成意义段的制约条件。实验证明,该数学模型反映了一类文章的客观结构。
关键词 计算机 文章 意义段划分 三角矩阵 教学
下载PDF
近十年我国电子书包研究热点与发展趋势——基于共词矩阵的知识图谱分析 被引量:109
16
作者 王佑镁 陈慧斌 《中国电化教育》 CSSCI 北大核心 2014年第5期4-10,共7页
作为教育信息化进程中出现的教学新媒介,电子书包已经成为学术界高度关注的研究主题。该文以中国知网(CNKI)数据库2003-2013年收录的292篇电子书包研究相关的学术论文为研究对象,以共词矩阵、相似矩阵和多维尺度分析为研究方法,采用可... 作为教育信息化进程中出现的教学新媒介,电子书包已经成为学术界高度关注的研究主题。该文以中国知网(CNKI)数据库2003-2013年收录的292篇电子书包研究相关的学术论文为研究对象,以共词矩阵、相似矩阵和多维尺度分析为研究方法,采用可视化知识图谱探究近10年我国电子书包领域的研究现状和发展趋势。结果表明,我国电子书包研究主要围绕宏观主线和微观主线展开研究,当前的研究主要集中在电子书包利益相关者系统、技术标准、试点实施、应用模式及支撑产业五个方面;未来研究需要关注电子书包的使用需求、资源开发、政策及产业链协同、教学模式、理论开发及推广模式研究六个领域。 展开更多
关键词 电子书包 共词矩阵 聚类分析 知识图谱
下载PDF
基于内容分析法的国家和地方科技创新政策构成对比分析 被引量:64
17
作者 苏敬勤 李晓昂 许昕傲 《科学学与科学技术管理》 CSSCI 北大核心 2012年第6期15-21,共7页
运用内容分析方法对我国国家科技创新政策和大连市科技创新政策的构成进行对比分析,选取Ucinet软件处理数据,将分析结果用网络图显示,并在此基础上,总结出两者的联系和区别。
关键词 内容分析 共词矩阵 科技创新政策 国家地方对比
原文传递
基于向量空间模型的有导词义消歧 被引量:37
18
作者 鲁松 白硕 +1 位作者 黄雄 张健 《计算机研究与发展》 EI CSCD 北大核心 2001年第6期662-667,共6页
词义消歧一直是自然语言理解中的一个关键问题 ,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣 .由于自然语言知识表示的困难 ,在手工规则的词义消歧难以达到理想效果的情况下 ,各种有导机器学习方法被应用于词义消... 词义消歧一直是自然语言理解中的一个关键问题 ,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣 .由于自然语言知识表示的困难 ,在手工规则的词义消歧难以达到理想效果的情况下 ,各种有导机器学习方法被应用于词义消歧任务中 .借鉴前人的成果引入信息检索领域中向量空间模型文档词语权重计算技术来解决多义词义项的知识表示问题 ,并提出了上下文位置权重的计算方法 ,给出了一种基于向量空间模型的词义消歧有导机器学习方法 .该方法将多义词的义项和上下文分别映射到向量空间中 ,通过计算多义词上下文向量与义项向量的距离 ,采用 k- NN(k=1)方法来确定上下文向量的义项分类 .在 9个汉语高频多义词的开放和封闭测试中均取得了突出的成绩 (封闭测试平均正确率为 96 .31% ,开放测试平均正确率为 92 .98% ) 。 展开更多
关键词 词义消歧 向量空间模型 义项矩阵 自然语言理解 有导机器学习
下载PDF
国内竞争情报领域研究论文的共词聚类分析 被引量:40
19
作者 曹玲 杨静 夏严 《情报科学》 CSSCI 北大核心 2010年第6期923-925,930,共4页
利用《CNKI中国期刊全文数据库》中收录的1997~2008年与竞争情报相关的期刊论文为基础,采用Bibexcel进行词频统计以及SPSS软件进行共词聚类分析,研究各高频关键词之间的内在联系,分析竞争情报领域的研究热点,管窥国内竞争情报领域的研... 利用《CNKI中国期刊全文数据库》中收录的1997~2008年与竞争情报相关的期刊论文为基础,采用Bibexcel进行词频统计以及SPSS软件进行共词聚类分析,研究各高频关键词之间的内在联系,分析竞争情报领域的研究热点,管窥国内竞争情报领域的研究现状。 展开更多
关键词 竞争情报 Bibexcel 词频统计 SPSS 共词分析 聚类分析
原文传递
基于共词分析的文本主题词聚类与主题发现 被引量:34
20
作者 王小华 徐宁 谌志群 《情报科学》 CSSCI 北大核心 2011年第11期1621-1624,共4页
文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法... 文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法对主题词串进行聚类分析,从而发现主题。实验结果表明,该方法对热点主题提取有一定的效果。 展开更多
关键词 共词分析 TF-IDF 共词矩阵 Bisecting K-MEANS 主题
原文传递
上一页 1 2 6 下一页 到第
使用帮助 返回顶部