期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
一种改进的快速分词算法 被引量:56
1
作者 陈桂林 王永成 +1 位作者 王刚 《计算机研究与发展》 EI CSCD 北大核心 2000年第4期418-424,共7页
首先介绍了一种高效的中文电子词表数据结构 ,它支持首字 Hash和标准的二分查找 ,且不限词条长度 ;然后提出了一种改进的快速分词算法 ,在快速查找两字词的基础上 ,利用近邻匹配方法来查找多字词 ,明显提高了分词效率 .理论分析表明 ,... 首先介绍了一种高效的中文电子词表数据结构 ,它支持首字 Hash和标准的二分查找 ,且不限词条长度 ;然后提出了一种改进的快速分词算法 ,在快速查找两字词的基础上 ,利用近邻匹配方法来查找多字词 ,明显提高了分词效率 .理论分析表明 ,该分词算法的时间复杂度为 1.6 6 ,在速度方面 。 展开更多
关键词 分词 中文信息处理 算法 中文电子词表 计算机
下载PDF
文本挖掘、数据挖掘和知识管理——二十一世纪的智能信息处理 被引量:63
2
作者 王永成 《情报学报》 CSSCI 北大核心 2001年第1期100-104,共5页
本文首先介绍了数据挖掘、文本挖掘和知识管理等概念 ,然后从技术角度出发 ,将知识管理划分为知识库、知识共享和知识发现三个阶段 ,分析了作为最高阶段的知识发现的关键技术和意义 。
关键词 文本挖掘 数据挖掘 知识管理 知识发现 智能信息处理 搜索引擎 挖掘引擎
下载PDF
无词典高频字串快速提取和统计算法研究 被引量:36
3
作者 王永成 陈桂林 《中文信息学报》 CSCD 北大核心 2001年第2期23-30,共8页
本文提出了一种快速的高频字串提取和统计方法。使用Hash技术 ,该方法不需要词典 ,也不需要语料库的训练 ,不进行分词操作 ,依靠统计信息 ,提取高频字串。用语言学知识进行前缀后缀等处理后 ,得到的高频字串可以作为未登录词处理、歧义... 本文提出了一种快速的高频字串提取和统计方法。使用Hash技术 ,该方法不需要词典 ,也不需要语料库的训练 ,不进行分词操作 ,依靠统计信息 ,提取高频字串。用语言学知识进行前缀后缀等处理后 ,得到的高频字串可以作为未登录词处理、歧义消解和加权处理等的辅助信息。实验显示了该方法速度较快且不受文章本身的限制 。 展开更多
关键词 Hash技术 高频字串 统计 算法 提取 文本信息处理 语料库 前缀处理 后缀处理
下载PDF
汉语语言的无词典分词模型系统 被引量:22
4
作者 王永成 陈桂林 《计算机应用研究》 CSCD 1999年第10期8-9,共2页
本文主要人人知识的自动获取出发;介绍了研究中的汉语语言的无词典分词模型系统、通过算法的自然语言描述,阐述了模型的思想,分析了它与传统方法相比的优点,提出了要使系统达到实用还需解决的几个问题。
关键词 中文信息处理 知识自动获取 分词模型 汉语语言
下载PDF
中文全文标引的主题词标引和主题概念标引方法 被引量:41
5
作者 王永成 《情报学报》 CSSCI 北大核心 2001年第2期212-216,共5页
中文全文标引正在越来越受到重视。本文主要研究了三个方面的问题 ,首先是全文主题词标引的加权问题 ,综合考虑了五个方面的因素 ;其次是介绍了一种用层次概念词典改进主题词标引质量的新方法 ;最后又提出了用三种不同的方法产生主题概... 中文全文标引正在越来越受到重视。本文主要研究了三个方面的问题 ,首先是全文主题词标引的加权问题 ,综合考虑了五个方面的因素 ;其次是介绍了一种用层次概念词典改进主题词标引质量的新方法 ;最后又提出了用三种不同的方法产生主题概念进行全文标引的的主题概念标引。受限范围内的实验结果显示本文的方法有一定的理论和实用价值。 展开更多
关键词 主题词引 主题概念标引 层次概念词典 自动标引 中文全文标引
下载PDF
一种高效的中文电子词表数据结构 被引量:26
6
作者 陈桂林 王永成 +1 位作者 王刚 《计算机研究与发展》 EI CSCD 北大核心 2000年第1期109-116,共8页
在分析中文字编码体系、中文词一些特点的基础上,文中提出了一种新的中文电子词表数据结构,并讨论了利用首字Hash 加二分查找的数据查找算法以及相关的数据更新、删除和插入算法. 理论分析和试验结果表明。
关键词 中文信息处理 中文电子词表 数据结构 计算机
下载PDF
复杂背景下红外点目标检测的预处理 被引量:26
7
作者 《系统工程与电子技术》 EI CSCD 2000年第1期52-54,共3页
研究了复杂背景下红外点目标检测的预处理方法。首先给出了红外点目标的场景图像模型,定义了信噪比,然后给出了点目标增强和背景抑制的方法,分别是去图像局部均值和白化处理。最后是预处理的实验结果和方法的性能分析。
关键词 信号处理 红外点目标 目标检测
下载PDF
一种用于主题提取的非线性加权方法 被引量:25
8
作者 王永成 《情报学报》 CSSCI 北大核心 2000年第6期650-653,共4页
主题提取是文本处理的一项重要工作。本文首先分析了主题抽取中加权方法形成时的一些定量问题 ,然后提出了主题相关词一种非线性加权处理方法 ,对比实验结果显示它不仅是一种比较稳健的方法 ,而且能在一定程度上提高主题提取的正确率。
关键词 主题提取 非线性 加权 主题标引 计算机自动标引
下载PDF
三个层面的中文文本主题自动提取研究 被引量:13
9
作者 王永成 +1 位作者 沈洲 吴芳芳 《中文信息学报》 CSCD 北大核心 2001年第4期20-27,共8页
为适应Internet时代和大规模文献处理的需要 ,以中文文本为处理对象 ,研究了从主题词、主题概念和主题句三个不同层面自动抽取文本主题的方法 ,着重讨论了加权体系和一些经验值的获取方法。对新闻类文献做了实验 。
关键词 主题词 主题概念 主题句 加权 中文文本 主题提取 文本处理
下载PDF
Web页面中文文本主题的自动提取研究 被引量:12
10
作者 王永成 滕伟 《情报学报》 CSSCI 北大核心 2001年第2期217-223,共7页
Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的... Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。 展开更多
关键词 Web页面文本 主题抽取 加权 机器标引 主题标引
下载PDF
利用串匹配技术实现网上新闻的主题提取(英文) 被引量:11
11
作者 尹中航 王永成 +1 位作者 蔡巍 《软件学报》 EI CSCD 北大核心 2002年第2期159-167,共9页
从文本中提取主题串是自然语言处理的重要基础之一.传统的提取方法主要是依据“词典加匹配”的模式.由于词典的更新速度无法同步于网上新闻中新词汇涌现的速度,而且词典的内容也无法完全涵盖网上新闻的范围, 因此这种方法不适用于网上... 从文本中提取主题串是自然语言处理的重要基础之一.传统的提取方法主要是依据“词典加匹配”的模式.由于词典的更新速度无法同步于网上新闻中新词汇涌现的速度,而且词典的内容也无法完全涵盖网上新闻的范围, 因此这种方法不适用于网上新闻的主题提取.提出并实现了一种不用词典即可提取新闻主题的新方法.该方法利用网上新闻的特殊结构,在标题和正文间寻找重复的字串.经过简单地处理,这些字串能够较好地反映新闻的主题.实验结果显示该方法能够准确、有效地提取出绝大部分网上新闻的主题,满足新闻自动处理的需要.该方法同样适用于其它亚洲语言和西方语言. 展开更多
关键词 网页 信息处理 网上新闻 主题提取 自然语言处理 串匹配技术
下载PDF
复杂背景下红外点目标检测的预处理 被引量:11
12
作者 《红外技术》 CSCD 北大核心 1999年第4期36-39,共4页
研究了复杂背景下红外点目标检测的预处理方法。首先给出了红外点目标的场景图像模型,定义了信噪比,然后给出了点目标增强和背景抑制的方法,分别是去图像局部均值和白化处理。最后是预处理的实验结果和方法的性能分析。
关键词 点目标 预处理 背景抑制 红外成象系统
下载PDF
一种快速单模式准确匹配算法 被引量:4
13
作者 王永成 陈桂林 《上海交通大学学报》 EI CAS CSCD 北大核心 2001年第2期192-196,共5页
引入连续跳跃查找文本的思想 ,提出了一种新的单模式精确匹配算法 ,其最优条件下的时间复杂度为 O[n/(m+1 ) ],新算法的平均时间复杂度分析表明其具有优越的查找性能 .对比实验结果显示 ,新算法的性能优于目前所见的同类算法 ,特别是在... 引入连续跳跃查找文本的思想 ,提出了一种新的单模式精确匹配算法 ,其最优条件下的时间复杂度为 O[n/(m+1 ) ],新算法的平均时间复杂度分析表明其具有优越的查找性能 .对比实验结果显示 ,新算法的性能优于目前所见的同类算法 ,特别是在模式较短的情况下 ,优势更为明显 ,这一特点非常适合于自然语言文本的检索 . 展开更多
关键词 模式匹配 波艺尔-默尔算法 快速搜索算法 时间复杂度 算法
下载PDF
自动标引中基于概念层次树的主题词轮排选择的算法实现 被引量:4
14
作者 马颖华 王永成 +2 位作者 苏贵洋 赵海 《高技术通讯》 EI CAS CSCD 2003年第6期18-21,共4页
提出了一种基于概念层次树的主题词轮排选择的实现算法。根据概念层次树中所包含的主题词上下位信息对待标引的文本候选主题词的权重进行调整,并扩充未出现在文本中的上位主题概念。最后根据概念层次树中所包含的主题词类属信息对不同... 提出了一种基于概念层次树的主题词轮排选择的实现算法。根据概念层次树中所包含的主题词上下位信息对待标引的文本候选主题词的权重进行调整,并扩充未出现在文本中的上位主题概念。最后根据概念层次树中所包含的主题词类属信息对不同类属的候选主题词进行轮排选词。实验显示,该算法产生的自动标引结果比单纯按权重排序的方法能更好地表现文本的主题。 展开更多
关键词 自动标引 概念层次树 主题词 轮排选择 算法 主题概念森林 权值 上位主题
下载PDF
一种快速的字串交叉模式匹配算法 被引量:6
15
作者 鲍峥嵘 王永成 +1 位作者 刘功申 《上海交通大学学报》 EI CAS CSCD 北大核心 2003年第3期420-423,427,共5页
介绍了一种基于高频字串提取的快速字串交叉模式匹配算法 ,同已有的 KMP、BM等单模式匹配算法和有限自动机等多模式匹配算法相比 ,在字符集Σ较大且字串个数远大于字串最大长度的情况下 ,该算法具有较低的时间复杂度和空间复杂度 ,并适... 介绍了一种基于高频字串提取的快速字串交叉模式匹配算法 ,同已有的 KMP、BM等单模式匹配算法和有限自动机等多模式匹配算法相比 ,在字符集Σ较大且字串个数远大于字串最大长度的情况下 ,该算法具有较低的时间复杂度和空间复杂度 ,并适用于字符集较大 。 展开更多
关键词 模式匹配 高频字串 算法
下载PDF
生物学文献自动标引系统的理论和实践 被引量:8
16
作者 王永成 王刚 《情报学报》 CSSCI 北大核心 2000年第3期259-264,共6页
在统计分析生物学中文文献的一些特点和手工标引的经验的基础上 ,本文介绍了以文献标题和摘要为标引源的自动标引方法。文章着重介绍了折半匹配的抽词和基于非线性加权体系的标引词抽取的理论和实践。
关键词 生物学文献 自动标引 折半匹配 非线性加权体系 文献标题 摘要 标引源 标引词抽取
下载PDF
红外序列图像中缓动点目标的流水线检测算法 被引量:8
17
作者 王永成 《系统工程与电子技术》 EI CSCD 2000年第8期66-67,84,共3页
主要讨论了红外序列图像中缓动点目标的流水线检测算法。把序列图像看成一个三维空间 ,设计了两个流水线 ,即分割流水线和检测流水线。前者通过求差值图像的门限分割 ,获得侯选目标点 ;后者对剩下的目标点进行窗口幅值累加和门限处理 ,... 主要讨论了红外序列图像中缓动点目标的流水线检测算法。把序列图像看成一个三维空间 ,设计了两个流水线 ,即分割流水线和检测流水线。前者通过求差值图像的门限分割 ,获得侯选目标点 ;后者对剩下的目标点进行窗口幅值累加和门限处理 ,获得目标点。实验显示 ,可以用 15帧图像较高效地检测出目标。最后对算法的性能和实验结果作了分析。 展开更多
关键词 红外图像 目标识别 流水线检测算法
下载PDF
多态运动目标的智能跟踪策略 被引量:2
18
作者 刘芳 《系统工程与电子技术》 EI CSCD 1999年第11期29-31,共3页
首先定量分析了多态运动目标的成像特点。将目标成像划分为几个阶段,然后讨论了各个阶段目标跟踪的一般方法。最后提出了基于自动机模型的多态运动目标的智能跟踪策略。
关键词 目标跟踪 智能跟踪策略 多目标跟踪 雷达
下载PDF
一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践 被引量:2
19
作者 沈洲 王永成 《高技术通讯》 EI CAS CSCD 2001年第9期28-32,共5页
介绍了一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践。首先阐述了主题敏感辞分析的心理语言学基础 ,然后详细介绍了系统中的主题敏感辞的获取、敏感辞修饰关系分析、敏感辞同现关系分析等步骤 ,最后给出了该系统与原有摘... 介绍了一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践。首先阐述了主题敏感辞分析的心理语言学基础 ,然后详细介绍了系统中的主题敏感辞的获取、敏感辞修饰关系分析、敏感辞同现关系分析等步骤 ,最后给出了该系统与原有摘要系统评价测试对比结果。评测结果显示 。 展开更多
关键词 自然语言处理 主题敏感辞分析 自动摘要系统 心理语言学 网络新闻 电子信息
下载PDF
缓动点目标的流水线检测算法 被引量:1
20
作者 《现代防御技术》 1999年第4期34-37,共4页
讨论了复杂背景下缓动点目标的流水线检测算法。通过两个流水线,分割流水线和检测流水线,可以用15帧图像满意地检测出目标。对算法的性能和实验结果作了分析。
关键词 点目标 流水线检测算法 精密成像制导 制导
全文增补中
上一页 1 2 下一页 到第
使用帮助 返回顶部