期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于贝叶斯算法的中国人名识别 被引量:12
1
作者 周波 杨国纬 《计算机应用》 CSCD 北大核心 2006年第4期998-1000,共3页
在常规的使用概率统计人名方法的基础上,提出了使用贝叶斯分类法识别句子中中国人名的方法。通过使用贝叶斯分类算法计算汉字串分别成为中国人名的概率和成为非中国人名的概率,可以有效地识别出汉语句子中的中国人名。该方法的识别公式... 在常规的使用概率统计人名方法的基础上,提出了使用贝叶斯分类法识别句子中中国人名的方法。通过使用贝叶斯分类算法计算汉字串分别成为中国人名的概率和成为非中国人名的概率,可以有效地识别出汉语句子中的中国人名。该方法的识别公式简单,并且具有一定的学习能力,在与其他一些辅助技术结合起来的情况下,可以获得比较好的中国人名识别效果。 展开更多
关键词 汉语分词 中国人名识别 贝叶斯分类法
下载PDF
智能信息Agent的研究和实现 被引量:3
2
作者 陈红英 李卫华 《计算机工程与应用》 CSCD 北大核心 2002年第12期125-127,共3页
文章全面地介绍了一个采用了多种机器学习技术的智能搜索Agent的实现方法,对智能搜索Agent各部分组成和实现方法进行了具体讨论。
关键词 智能信息Agent 兴趣学习 ID3算法 机器学习 人工智能
下载PDF
一种基于本体论和规则匹配的中文人名识别方法 被引量:5
3
作者 周昆 胡学钢 《微计算机信息》 2010年第31期87-89,共3页
未登录词识别是中文信息处理的一个难点,未登录词识别技术的突破对提高汉语自动分词和句法分析的准确性都有很重要的意义。在未登录词中,仅中文姓名就占15%之多,由此可见中文姓名识别对于未登录词识别乃至整个自动分词技术的重要性。本... 未登录词识别是中文信息处理的一个难点,未登录词识别技术的突破对提高汉语自动分词和句法分析的准确性都有很重要的意义。在未登录词中,仅中文姓名就占15%之多,由此可见中文姓名识别对于未登录词识别乃至整个自动分词技术的重要性。本文设计了一种基于本体论和规则匹配的中文人名识别方法,首先基于本体构建中文人名层次分类体系,于分词的过程中指导源文本中候选人名的提取,然后根据规则库匹配修正候选人名,同时分析识别结果生成新的规则反馈给规则库。该方法能够对中文人名知识库进行有效的组织,同时具有一定的自学习的能力,可以获得比较好的中文人名识别效果。 展开更多
关键词 中文人名识别 命名实体识别 中文分词 本体
下载PDF
一种快速Web中文分词算法的研究 被引量:2
4
作者 韩利凯 《航空计算技术》 2007年第6期68-69,共2页
提出了一种快速Web分词算法,该算法采用首字哈希存储和词条等长分簇存储的思想,采用近邻匹配和二分查找相结合的查找算法,可以方便实现邻近匹配,提高了效率。
关键词 Web分词 中文分词 分簇存储 近邻匹配
下载PDF
智能答疑系统的中文分词 被引量:4
5
作者 付艳梅 《湖北工业大学学报》 2009年第1期65-67,共3页
对词库进行改造的基础上,提出了一种改进的匹配算法,突破了最大匹配分词算法分词的长度限制,提高了中文分词的速度和效率.
关键词 智能答疑系统 中文分词 分词算法
下载PDF
基于自适应互动式的元搜索引擎
6
作者 王继生 王一莉 《计算机工程与设计》 CSCD 北大核心 2009年第7期1656-1659,1663,共5页
搜索引擎用户个性化的研究是搜索引擎优化的一个研究热点。一些检索系统不能满足用户的需求,提出了一种基于自适应互动式的元搜索引擎,系统借助于用户在和元搜索引擎交互的过程中用户的行为记录为用户动态的生成其偏好的查询接口,用户... 搜索引擎用户个性化的研究是搜索引擎优化的一个研究热点。一些检索系统不能满足用户的需求,提出了一种基于自适应互动式的元搜索引擎,系统借助于用户在和元搜索引擎交互的过程中用户的行为记录为用户动态的生成其偏好的查询接口,用户与元搜索引擎交互的过程中动态更新用户行为模型,自适应的满足不同检索动机的用户的信息需求,利用CC4神经网络在对网页的相关行进行判断对返回结果重新排序。 展开更多
关键词 元搜索引擎 神经网络 相关性 中文分词 自适应
下载PDF
基于PSO和KNN的网页智能分类算法 被引量:1
7
作者 唐朝霞 《太原师范学院学报(自然科学版)》 2010年第4期55-58,共4页
随着Internet技术的不断发展,Web信息不断的变化和增长.为有效查找用户所需要的信息,需将传统的信息检索向Web信息检索方向发展.如果预先对网页文本进行分类,则面对用户的检索需求就可以在相应的类别中进行查找,这样大大提高了检索的效... 随着Internet技术的不断发展,Web信息不断的变化和增长.为有效查找用户所需要的信息,需将传统的信息检索向Web信息检索方向发展.如果预先对网页文本进行分类,则面对用户的检索需求就可以在相应的类别中进行查找,这样大大提高了检索的效率.文章通过对网页进行预处理,中文分词,特征提取,再使用KNN分类算法对网页进行智能分类,并采用了PSO算法快速寻找K近邻.实验结果表明:该方法不仅减少了网页分类时间,准确率、召回率和F1标准也明显提高,有效地提高了网页智能分类的效率. 展开更多
关键词 中文分词 特征提取 智能分类 KNN分类算法 PSO算法
下载PDF
中文信息检索关键技术分析
8
作者 王冬 《电脑知识与技术》 2007年第8期770-771,共2页
本文对Web中文信息检索进行了简介,分析了Web中文信息检索的几个关键技术,总结时下流行的中文搜索引擎技术。笔者还提出了一些心得、体会和设想,最后对智能中文搜索引擎进行了展望。
关键词 信息检索 搜索引擎 网络爬虫 中文分词 排序
下载PDF
中文信息检索关键技术分析 被引量:1
9
作者 王冬 张运波 黄应红 《电脑知识与技术》 2007年第9期1309-1310,共2页
本文对Web中文信息检索进行了简介,分析了Web中文信息检索的几个关键技术,总结时下流行的中文搜索引擎技术。笔者还提出了一些心得、体会和设想,最后对智能中文搜索引擎进行了展望。
关键词 信息检索 搜索引擎 网络爬虫 中文分词 排序
下载PDF
面向主题的元搜索引擎 被引量:1
10
作者 王继生 王一莉 《计算机工程与设计》 CSCD 北大核心 2009年第4期909-911,共3页
介绍了一种基于神经网络的面向主题的元搜索引擎。它使用神经网络对检索结果进行优化排序,它先对返回结果进行中文分词,在充分挖掘其语义信息的基础上,利用CC4神经网络对网页的相关性进行判断,对返回结果重新排序,很好地解决了综合性搜... 介绍了一种基于神经网络的面向主题的元搜索引擎。它使用神经网络对检索结果进行优化排序,它先对返回结果进行中文分词,在充分挖掘其语义信息的基础上,利用CC4神经网络对网页的相关性进行判断,对返回结果重新排序,很好地解决了综合性搜索引擎中普遍存在搜索结果不准确、信息滞后等问题。实验结果表明,该方法对结果进行了最优化排序,实际执行性能较好。 展开更多
关键词 面向主题 元搜索引擎 神经网络 相关性 中文分词
下载PDF
基于汉语框架的语义标注方法
11
作者 刘勇 魏光泽 《计算机科学》 CSCD 北大核心 2015年第S1期98-101,共4页
标注语料库中句子的语义信息应该要有一套完整的规范体系。利用汉语框架和框架元素体系进行标注,首先介绍基于汉语框架的语义标注方法的概念;接着从句法功能、短语类型和框架元素标注这3个方面对汉语框架语义标注的具体规范进行阐述;最... 标注语料库中句子的语义信息应该要有一套完整的规范体系。利用汉语框架和框架元素体系进行标注,首先介绍基于汉语框架的语义标注方法的概念;接着从句法功能、短语类型和框架元素标注这3个方面对汉语框架语义标注的具体规范进行阐述;最后,通过与其他语义标注方法比较分析,得出框架语义标注的特点。 展开更多
关键词 框架语义 语义标注 中文分词
下载PDF
科技档案管理系统设计
12
作者 马丁 万建新 《甘肃冶金》 2018年第3期117-119,共3页
介绍了科技档案管理系统的设计思路,并对使用LAMP网站框架搭建档案管理系统过程中的关键技术(如中文分词技术)等进行了相关的描述。
关键词 档案 PHP LAMP SCWS 中文分词
下载PDF
文本挖掘中的中文分词算法研究及实现 被引量:14
13
作者 许高建 胡学钢 王庆人 《计算机技术与发展》 2007年第12期122-124,172,共4页
文本挖掘是指使用数据挖掘技术,自动地从文本数据中发现和提取独立于用户信息需求的文档集中的隐含知识。而中文文本数据的获得是依靠中文信息处理技术来进行的,因而自动分词成为中文信息处理中的基础课题。对于海量信息处理的应用,分... 文本挖掘是指使用数据挖掘技术,自动地从文本数据中发现和提取独立于用户信息需求的文档集中的隐含知识。而中文文本数据的获得是依靠中文信息处理技术来进行的,因而自动分词成为中文信息处理中的基础课题。对于海量信息处理的应用,分词的速度是极为重要的,对整个系统的效率有很大的影响。分析了几种常见的分词方法,设计了一个基于正向最大匹配法的中文自动分词系统。为了提高分词的精度,对加强歧义消除和词语优化的算法进行了研究处理。 展开更多
关键词 中文分词 歧义消除 最大匹配 词语优化
下载PDF
中文分词技术研究进展综述 被引量:7
14
作者 钟昕妤 李燕 《软件导刊》 2023年第2期225-230,共6页
中文分词作为实现机器处理中文的一项基础任务,是近几年的研究热点之一。其结果对后续处理任务具有深远影响,具备充分的研究意义。通过对近5年分词技术研究文献的综合分析,明晰后续研究将以基于神经网络模型的融合方法为主导,进一步追... 中文分词作为实现机器处理中文的一项基础任务,是近几年的研究热点之一。其结果对后续处理任务具有深远影响,具备充分的研究意义。通过对近5年分词技术研究文献的综合分析,明晰后续研究将以基于神经网络模型的融合方法为主导,进一步追求更精准高效的分词表现。而在分词技术的发展与普及应用中,亦存在着制约其性能的各项瓶颈。除传统的歧义和未登录词问题外,分词还面临着语料规模质量依赖和多领域分词等新难题,针对这些新问题的突破研究将成为后续研究的重点之一。 展开更多
关键词 中文分词 深度学习 语料依赖 多领域分词
下载PDF
电子病历中文字词及其分布规律研究——以妇幼保健院电子病历为例
15
作者 肖春华 张礼成 +1 位作者 丁腊春 叶恩光 《中国数字医学》 2024年第3期47-51,共5页
目的:通过研究电子病历中文字词提取及字词分布规律,探讨妇幼病历中文字词分布规律及特征词库构建。方法:以不同城市的两所妇幼保健医院某年患者全量电子病历为例,按互联网通用词库、医疗术语库、医疗术语分词库、病历分词库、术语及病... 目的:通过研究电子病历中文字词提取及字词分布规律,探讨妇幼病历中文字词分布规律及特征词库构建。方法:以不同城市的两所妇幼保健医院某年患者全量电子病历为例,按互联网通用词库、医疗术语库、医疗术语分词库、病历分词库、术语及病历分词联合分词库等不同字词库对电子病历样本进行字词对比统计分析,并以此分析提取出妇幼病历字词分布规律及其字词特征。结果:妇幼病历样本统计结果表明,妇幼病历中文字词相对集中、量级有限、分布有规律、字词特征明显。结论:妇幼电子病历中文字词及其分布规律研究表明,妇幼电子病历中文字集中在2 000个左右,中文词也是集中在2 000个以内,妇幼特征词共有3 178个,因此以妇幼电子病历为例进行中文字词研究具有重要意义,对后期电子病历智能应用与开发具有参考价值。 展开更多
关键词 病历样本 病历分词 中文字词 医疗术语 术语分词
下载PDF
一种实用智能答疑系统在现代远程教育中的应用 被引量:4
16
作者 王红雨 《电脑开发与应用》 2005年第9期32-34,共3页
简要介绍了现代教育及答疑系统的应用,分析了目前答疑系统存在的一些问题,提出了一个实用的智能答疑系统的模型。通过XML技术组织答案知识库,利用基于统计的方法进行分词与匹配,有效地提高了查询的精度。通过对知识进行系统的分类以及... 简要介绍了现代教育及答疑系统的应用,分析了目前答疑系统存在的一些问题,提出了一个实用的智能答疑系统的模型。通过XML技术组织答案知识库,利用基于统计的方法进行分词与匹配,有效地提高了查询的精度。通过对知识进行系统的分类以及与学员的交互,缩小了搜索范围和时间,提高了答案的命中率。 展开更多
关键词 智能答疑系统 知识库 远程教育 汉语分词 搜索 XML
下载PDF
一种关键字过滤系统下的DFA分词算法设计与优化 被引量:4
17
作者 刘利俊 《计算机应用与软件》 CSCD 北大核心 2012年第1期284-287,共4页
Internet的迅猛发展和电子商务应用的日益普及,越来越多的网络应用程序需要高效地对违禁用语、禁限售商品等关键字进行高效过滤和处理。分析关键字过滤的基本原理,对现有关键字过滤算法进行了优化和功能增强,设计并实现了一个实时环境... Internet的迅猛发展和电子商务应用的日益普及,越来越多的网络应用程序需要高效地对违禁用语、禁限售商品等关键字进行高效过滤和处理。分析关键字过滤的基本原理,对现有关键字过滤算法进行了优化和功能增强,设计并实现了一个实时环境下互联网关键字过滤系统。 展开更多
关键词 中文分词 DFA 双数组
下载PDF
“并列结构”的汉语短句英译探究——全国翻译资格考试《笔译实务》参考译文辨析 被引量:2
18
作者 彭洪明 《河北师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2013年第5期157-160,共4页
由于不同民族思维模式及相关社会背景文化差异,使得汉语和英语两种语言在表达方式上有很大的区别,尤其是复杂的长句子,有的表面上看上去像并列结构,其实不然,其中可能存在总说与分说,前因与结果等内在关系,因此,我们在把汉语翻译成英语... 由于不同民族思维模式及相关社会背景文化差异,使得汉语和英语两种语言在表达方式上有很大的区别,尤其是复杂的长句子,有的表面上看上去像并列结构,其实不然,其中可能存在总说与分说,前因与结果等内在关系,因此,我们在把汉语翻译成英语时,就不能完全按照汉语的句子结构和语言表达顺序来组织英语译文,而是要认真分析汉语句子字里行间的内在逻辑关系,根据英语表达的习惯来组织英语译文,否则译文就会出现偏差,甚至扭曲原文,造成误译。 展开更多
关键词 复杂长句 汉译英 并列结构 分词结构
下载PDF
基于梵汉对勘的东汉译经中“V(O)已”结构研究
19
作者 孟奕辰 方一新 《江西师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2020年第6期82-88,共7页
中古时期,汉译佛经语料中的“V(O)已”结构较为常见,前辈学者已有讨论,但仍有问题尚未解决。梵汉对勘发现,表先行动作完结的“已2”主要对应梵文的绝对分词;表非先行动作完成的“已2”对应梵文过去分词,认为“已2”是在语言接触的影响下... 中古时期,汉译佛经语料中的“V(O)已”结构较为常见,前辈学者已有讨论,但仍有问题尚未解决。梵汉对勘发现,表先行动作完结的“已2”主要对应梵文的绝对分词;表非先行动作完成的“已2”对应梵文过去分词,认为“已2”是在语言接触的影响下,在汉语本有的“已1”基础上扩展而来的,受到了语言外部接触和内部发展的共同作用。 展开更多
关键词 东汉译经 “V(O)已”结构 梵汉对勘 梵文绝对分词 梵文过去分词
下载PDF
中文信息处理在动态几何软件领域的应用研究
20
作者 陈晓霞 《浙江科技学院学报》 CAS 2012年第1期30-34,共5页
阐述了中文信息处理技术在几何作图等动态几何领域内的应用现状。鉴于几何语言其本身相较于一般自然语言的特点,介绍了利用中文分词技术及其他自然语言处理技术来实现基于自然语言输入的动态几何作图的方法,主要包括GMMM算法和基于"... 阐述了中文信息处理技术在几何作图等动态几何领域内的应用现状。鉴于几何语言其本身相较于一般自然语言的特点,介绍了利用中文分词技术及其他自然语言处理技术来实现基于自然语言输入的动态几何作图的方法,主要包括GMMM算法和基于"分词词典"的分词方法及建立同义词库、使用语模匹配和语模词典等方法来形式化和规则化几何命题等内容,并提出在该领域的研究展望。 展开更多
关键词 中文信息处理 几何作图 动态几何 分词
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部