期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
汉语词性自动标注系统的设计与实现 被引量:4
1
作者 王素格 张永奎 《计算机工程》 CAS CSCD 北大核心 2001年第3期7-8,65,共3页
介绍了汉语词性自动标注系统的设计与实现.该系统实现了统计与规则相结合的方法进行汉语词性自动标注.描述了该系统的总体结构,以及所使用的非兼类词表、兼类词表、标记集和词性标注规则的组织,特别对稀疏矩阵及其存储方法进行了详... 介绍了汉语词性自动标注系统的设计与实现.该系统实现了统计与规则相结合的方法进行汉语词性自动标注.描述了该系统的总体结构,以及所使用的非兼类词表、兼类词表、标记集和词性标注规则的组织,特别对稀疏矩阵及其存储方法进行了详细的介绍。 展开更多
关键词 汉语词性自动标注系统 自然语言理解 语料库 神经网络 设计
下载PDF
Excel VBA技术在批量提取Word表格信息中的应用 被引量:3
2
作者 郑培寅 曹艳杰 余志远 《河南科技》 2019年第16期35-36,共2页
Excel和Word为Office办公软件的两种组件,在文字处理、数据统计分析方面有着强大的功能。在具体工作中,两者的数据交互极为常见。本文主要介绍在大批量数据背景下,通过VBA技术实现从Word文档中提取信息到Excel表格,实现数据的快速、准... Excel和Word为Office办公软件的两种组件,在文字处理、数据统计分析方面有着强大的功能。在具体工作中,两者的数据交互极为常见。本文主要介绍在大批量数据背景下,通过VBA技术实现从Word文档中提取信息到Excel表格,实现数据的快速、准确、自动转换。 展开更多
关键词 EXCEL VBA word表格 EXCEL 批量提取
下载PDF
笔顺输入法的汉字搜索算法研究 被引量:2
3
作者 常志玲 周庆敏 +1 位作者 王雷 肖乐 《微计算机信息》 北大核心 2006年第05X期205-206,193,共3页
结合开发实际,介绍了笔顺输入法中汉字搜索算法和字码表及词码表的生成过程。从排序和查找两方面考虑,首先将汉字字库生成汉字字码表,然后将字码表根据首笔进行分区,当用户输入首笔后由汉字字码表索引文件决定在哪个分区范围内进行查找... 结合开发实际,介绍了笔顺输入法中汉字搜索算法和字码表及词码表的生成过程。从排序和查找两方面考虑,首先将汉字字库生成汉字字码表,然后将字码表根据首笔进行分区,当用户输入首笔后由汉字字码表索引文件决定在哪个分区范围内进行查找。实例证明本方法满足查找速度要求。 展开更多
关键词 搜索算法 字码表 词码表 汉字输入法
下载PDF
小学生习作用字情况调查 被引量:2
4
作者 李玲莉 刘华 《课程.教材.教法》 CSSCI 北大核心 2011年第1期83-88,共6页
我们以国内几大作文网站的小学生习作为语料来源,建立了小学生作文语料库。从语料库统计出的数据看,所涉汉字8067种,其中2536个汉字覆盖全部语料的99%,而另外的5531个汉字仅覆盖了全部语料的1%。同时统计出高频字在小学各学段中... 我们以国内几大作文网站的小学生习作为语料来源,建立了小学生作文语料库。从语料库统计出的数据看,所涉汉字8067种,其中2536个汉字覆盖全部语料的99%,而另外的5531个汉字仅覆盖了全部语料的1%。同时统计出高频字在小学各学段中出现的字种量:第一学段有1800个,第二学段有2500个,第三学段有3000个。将小学生作文中的高频字与《现代汉语常用字表》和小学语文教材中出现的常用字进行分段比较后得出,在第一、第二、第三学段中分别有499、324、381个汉字不见于《现代汉语常用字表》,有220、159、268个汉字不见于现行的小学语文教材常用字。 展开更多
关键词 小学生 字种 字量 对比分析 字表
下载PDF
基于VBA的AutoCAD图形和Word表格的数据转换 被引量:2
5
作者 曹歆宏 《测绘》 2011年第2期80-83,共4页
简要介绍了AutoCAD和Word的对象模型,并通过实例详细阐述了由AutoCAD图形数据自动生成Word格式数据报表的技术原理。最后,结合实际代码验证了该方法的实用性和有效性。
关键词 VBA AUTOCAD word表格 对象模型:数据转换 界址点成果表
下载PDF
计算机信息处理的字表建立和字频统计 被引量:2
6
作者 李蓉蓉 李鸣 《南方冶金学院学报》 2005年第1期29-31,共3页
通过一个简单的程序,把计算机中的英、汉字符集按内码编排为一个总字表.并可以计算出某一指定的档案中出现的英、汉字元的字频.这些信息的取得,对计算机信息处理都有重要的帮助.
关键词 字频 字表 ASCII码 字符 字节
下载PDF
Word表格与Excel工作表的数据交换
7
作者 刘胜华 《计算机光盘软件与应用》 2011年第23期56-56,55,共2页
Office系列办公软件中,word和excel是使用频率最高的两个应用软件。数据的共享和资源的传递是提高工作效率,节约工作时间的重要方式和手段。本文介绍了数据交换的需求,分析了数据交换的方式与操作方法,讨论了Word表格与Excel工作表... Office系列办公软件中,word和excel是使用频率最高的两个应用软件。数据的共享和资源的传递是提高工作效率,节约工作时间的重要方式和手段。本文介绍了数据交换的需求,分析了数据交换的方式与操作方法,讨论了Word表格与Excel工作表的数据交换。 展开更多
关键词 word表格 EXCEL工作表 数据交换
下载PDF
工程数据的输出处理
8
作者 张怡芳 《计算机与现代化》 2001年第1期48-51,共4页
阐述了用 C语言编程进行输出的工程数据如何与 Word、Excel链接 ,把工程数据生成表格或图表的方法 。
关键词 C语言 数据处理 word表格 EXCEL图表 工程数据 程序设计
下载PDF
基于汉语情感词表的句子情感倾向分类研究 被引量:34
9
作者 王素格 杨安娜 李德玉 《计算机工程与应用》 CSCD 北大核心 2009年第24期153-155,161,共4页
提出了一种基于汉语情感词词表的加权线性组合的句子情感分类方法。该方法通过已有的五种资源构建了中文情感词词表,并采用加权线性组合的句子情感分类方法对句子进行情感类别判断。实验结果表明,直接利用词汇语言粒度的句子情感分类综... 提出了一种基于汉语情感词词表的加权线性组合的句子情感分类方法。该方法通过已有的五种资源构建了中文情感词词表,并采用加权线性组合的句子情感分类方法对句子进行情感类别判断。实验结果表明,直接利用词汇语言粒度的句子情感分类综合F值为78.62%,若加入了否定短语语言粒度后,句子情感分类的综合F值提高了4.14%。 展开更多
关键词 情感词表 加权线性组合 句子情感分类
下载PDF
基于最大熵模型的评价搭配识别 被引量:12
10
作者 方明 刘培玉 《计算机应用研究》 CSCD 北大核心 2011年第10期3714-3716,共3页
在分析酒店评论文本倾向性过程中,针对某些评价词语所产生的歧义性问题,提出一种基于最大熵的评价搭配识别的方法。该方法通过构建极性词表,挖掘出评价词语类别作为语义特征,将其与词、词性、距离、否定词特征结合构成最大熵的复合模板... 在分析酒店评论文本倾向性过程中,针对某些评价词语所产生的歧义性问题,提出一种基于最大熵的评价搭配识别的方法。该方法通过构建极性词表,挖掘出评价词语类别作为语义特征,将其与词、词性、距离、否定词特征结合构成最大熵的复合模板,采用最大熵模型进行评价搭配识别。实验结果证明,采用构建的最大熵复合模板进行评价搭配识别具有较高的准确率和识别性能。 展开更多
关键词 倾向性 评价搭配 最大熵 极性词表 评价词语类别 语义特征
下载PDF
国际中文教材熟语收录考察——以《新实用汉语课本》和《中文天地》为例
11
作者 陈彦辉 赵晓旋 《文化创新比较研究》 2023年第22期170-175,共6页
汉语熟语是汉语词汇的重要组成部分,也是国际中文教学的重难点。该文借助权威熟语词典、结合人工干预对教材中的熟语予以界定和统计,分析《新实用汉语课本》和《中文天地》这两套国际中文教材的熟语选用情况;并以《国际中文教育中文水... 汉语熟语是汉语词汇的重要组成部分,也是国际中文教学的重难点。该文借助权威熟语词典、结合人工干预对教材中的熟语予以界定和统计,分析《新实用汉语课本》和《中文天地》这两套国际中文教材的熟语选用情况;并以《国际中文教育中文水平等级标准》和汉语母语者使用频率为参照,考察教材熟语选用的科学性和实用性。发现不同教材的熟语选用数量相差较大、选用标准不一致,教材中高频熟语与“等级标准”共选熟语少,“等级标准”的熟语与实际教学需求匹配度也不高,建议研发专门的国际中文教学熟语大纲,促使编者能根据不同的教学目的合理地、灵活地选用熟语。 展开更多
关键词 熟语 国际中文教材 等级标准 词频 教材编排 常用词表
下载PDF
Automatic Event Trigger Word Extraction in Chinese Event 被引量:1
12
作者 Long Tian Wen Ma Wen Zhou 《Journal of Software Engineering and Applications》 2012年第12期208-212,共5页
As a basic unit of knowledge representation and an important means for information organization, event has drawn growing number of people’s attention, the research of event identification and extraction in natural la... As a basic unit of knowledge representation and an important means for information organization, event has drawn growing number of people’s attention, the research of event identification and extraction in natural language processing field is an important research topic in information extraction area, the recognition and extraction of event trigger word plays a decisive role in event identification and extraction. In this paper, the authors make experiment in Chinese Event Corpus CEC, and present a method of extracting event trigger word automatically that combines extended trigger word table and machine learning. The experiment result shows that the F-score of extracting event trigger word. can reach 71.2% by using this method. 展开更多
关键词 Information EXTRACTION EVENT TRIGGER word TRIGGER word table MACHINE learning
下载PDF
HSK自动化词频统计分析
13
作者 陶家骏 《暨南大学华文学院学报》 2005年第1期24-30,共7页
词频统计是中国汉语水平考试(HSK)的一个重要特征。最新开发的HSK词频统计系统(HSKWordAnalysisSystem,简称HSKWAS)旨在实现HSK词频自动统计。本文以该系统对HSK两套样题的词频统计分析为例说明该系统的特征、使用方法与效用。
关键词 统计分析 HSK 自动化 汉语水平考试 重要特征 词频统计 统计系统 word 自动统计 使用方法
下载PDF
两部中级汉语教材生词表编译比较
14
作者 吉庆波 王岩岩 《辽宁教育行政学院学报》 2007年第3期64-66,共3页
关于现行教材中的生词表编译问题的讨论由来已久,通过对两部中级汉语教材生词表编译的对比,可以发现其中存在的弊端,从而找出克服的办法并提出了几项编写原则及编写建议以及应注意的事项。
关键词 对外汉语 教材编写 中级教材 生词表编译
下载PDF
学习性词表研制的新范式——评《义务教育常用词表(草案)》 被引量:2
15
作者 洪桂治 《辞书研究》 2020年第1期46-53,I0002,共9页
《义务教育常用词表(草案)》首次发布了义务教育阶段最常用的15114个词语(17092个义项)。其出版意义重大,标志着我国中小学语文词汇教学有了可量化的标准。《义务教育常用词表(草案)》从研制理念、研制方法和体例三方面构建了学习性词... 《义务教育常用词表(草案)》首次发布了义务教育阶段最常用的15114个词语(17092个义项)。其出版意义重大,标志着我国中小学语文词汇教学有了可量化的标准。《义务教育常用词表(草案)》从研制理念、研制方法和体例三方面构建了学习性词表研制的新范式,在语文教学、教材教辅读物编写等领域具有重要的实践价值,也是词汇语义研究、其他学习性词表研制的基础性资源。 展开更多
关键词 词表 学习性 义类法
下载PDF
复杂表格在WORD中的精确制作及其排版技巧
16
作者 程书斌 《计算机时代》 2022年第3期70-72,共3页
复杂表格在学习和办公中广泛应用,但在《信息技术课程》的教材中并未提及利用Word精确制作复杂表格的方法。鉴于此,文章介绍了一种利用Word精确制作复杂表格的方法。该方法的基本思想是将复杂表格拆分成若干个简单二维表格,然后再进行... 复杂表格在学习和办公中广泛应用,但在《信息技术课程》的教材中并未提及利用Word精确制作复杂表格的方法。鉴于此,文章介绍了一种利用Word精确制作复杂表格的方法。该方法的基本思想是将复杂表格拆分成若干个简单二维表格,然后再进行合并。此法具有操作便捷和制表精确等特点,可有效提高办公效率。 展开更多
关键词 Microsoft word表格 精确 排版
下载PDF
韩国现代用汉字字表及其存在的问题 被引量:2
17
作者 王平 《山东师范大学学报(人文社会科学版)》 2012年第2期62-70,1,共9页
从字量、字形、码位及其相互关系等方面对韩国目前最具代表性的三张汉字字表进行调查和分析,对三张汉字字表进行匹配项、非匹配项和覆盖率统计,订正4888字表的实际字量,指出三张汉字字表在字形、码位等方面存在的问题及调整建议,是韩国... 从字量、字形、码位及其相互关系等方面对韩国目前最具代表性的三张汉字字表进行调查和分析,对三张汉字字表进行匹配项、非匹配项和覆盖率统计,订正4888字表的实际字量,指出三张汉字字表在字形、码位等方面存在的问题及调整建议,是韩国现代用汉字字量调查研究的初步成果。它将为韩国现代用汉字的字量研究、汉字文化圈内汉字的标准化研究、中日韩汉字共通化研究、汉字在韩国的传承与变异研究等提供准确的数据参考和资料支持。 展开更多
关键词 韩国 现代用汉字字表 覆盖率
下载PDF
基于卷积神经网络的敏感文件检测方法
18
作者 林学峰 夏元轶 +1 位作者 郭金龙 于晓文 《计算机与现代化》 2018年第7期28-32,共5页
近几年,电力行业信息化建设取得了巨大成就。企业办公文件、项目方案、项目合同等涉及行业秘密的文件越来越多地在互联网中传输,导致企业级敏感文件泄露。传统敏感文件识别方法基于敏感词库进行特征检测,检测速度快,但是存在较高的漏报... 近几年,电力行业信息化建设取得了巨大成就。企业办公文件、项目方案、项目合同等涉及行业秘密的文件越来越多地在互联网中传输,导致企业级敏感文件泄露。传统敏感文件识别方法基于敏感词库进行特征检测,检测速度快,但是存在较高的漏报率和误报率。本文提出一种基于深度学习的敏感文件检测方法,引入词向量及卷积神经网络算法,实现敏感文件精准分类。本文提出的识别企业级敏感文件的检测方法优点是不再依赖于特征关键字,降低了漏报率和误报率。 展开更多
关键词 敏感词库 词向量 卷积神经网络 深度学习 敏感文件检测
下载PDF
入声字在兰银官话、中原官话、东北方言中分派的统计分析 被引量:1
19
作者 包婷婷 《甘肃高师学报》 2009年第2期130-132,共3页
入声是古代的一个调类,在今官话方言中都已消失,分派到平、上、去声中去了.就《方言调查字表》所列入声字对照兰银官话、中原官话陇中片方言、东北方言做了穷尽性的统计,比较了这些入声字在上述方言中的分派情况.
关键词 兰银官话 中原官话 东北方言 古入声字
下载PDF
泰语新闻事件触发词抽取研究
20
作者 彭籍冲 王红斌 线岩团 《价值工程》 2017年第11期226-228,共3页
自然语言领域内事件抽取是信息抽取中一项重要的研究课题。事件触发词的识别与抽取在事件抽取中扮演着重要角色。针对目前缺少对泰语触发词识别与抽取的技术研究,提出了通过中文事件触发词入手构建初始泰语新闻事件触发词表,并根据初始... 自然语言领域内事件抽取是信息抽取中一项重要的研究课题。事件触发词的识别与抽取在事件抽取中扮演着重要角色。针对目前缺少对泰语触发词识别与抽取的技术研究,提出了通过中文事件触发词入手构建初始泰语新闻事件触发词表,并根据初始泰语新闻事件触发词表自动抽取泰语触发词。实验结果表明此方法很好有效的实现了泰语新闻事件触发词的识别与抽取。 展开更多
关键词 事件抽取 新闻事件 泰语触发词表 触发词抽取
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部