期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
中文网页分类研究与系统实现 被引量:12
1
作者 段军峰 黄维通 陆玉昌 《计算机科学》 CSCD 北大核心 2007年第6期210-213,共4页
近年来,网页分类研究逐渐成为网络挖掘和文本挖掘的研究热点,针对中文网页分类的研究也日益增多。本文详细介绍了一个中文网页分类系统的设计与实现,并且提出了一些网页预处理和特征处理的方法。实验结果表明,本文的方法可以使中文网页... 近年来,网页分类研究逐渐成为网络挖掘和文本挖掘的研究热点,针对中文网页分类的研究也日益增多。本文详细介绍了一个中文网页分类系统的设计与实现,并且提出了一些网页预处理和特征处理的方法。实验结果表明,本文的方法可以使中文网页分类性能由81.5%提高至94.9%。 展开更多
关键词 中文网页分类 网页预处理 特征抽取
下载PDF
网络舆情中的信息预处理与自动摘要算法 被引量:8
2
作者 廉捷 刘云 《北京交通大学学报》 CAS CSCD 北大核心 2010年第5期94-99,共6页
提出了一套从互联网原始数据中提取有效信息,利用网页模版对这些信息进行格式化整理,并依据网络舆情的特点对正文信息进行自动摘要处理,在自动摘要处理过程中引入倒排索引概念简化了算法复杂度,基于关键词的权重分析保证了算法能够更准... 提出了一套从互联网原始数据中提取有效信息,利用网页模版对这些信息进行格式化整理,并依据网络舆情的特点对正文信息进行自动摘要处理,在自动摘要处理过程中引入倒排索引概念简化了算法复杂度,基于关键词的权重分析保证了算法能够更准确的找到人们关心的信息.测试结果支持了本文提出的算法. 展开更多
关键词 自动摘要 网页预处理 信息抽取 倒排索引 网络舆情
下载PDF
HTML文本自动分类预处理方法的研究应用 被引量:4
3
作者 刘冬梅 王俊义 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第1期75-78,共4页
研究了HTM L标记对网页内容的修饰作用,以前人理论为基础设计和实现了基于HTM L标记的网页分析和加权策略与算法.经实验比较,加入预处理算法后,提高了分类器的分类效率,验证了所提出方法的有效性.
关键词 网页自动分类 HTML 网页预处理
下载PDF
网页分类及其维文信息检索中的应用研究 被引量:2
4
作者 海丽且木·艾沙 维尼拉·木沙江 《电脑知识与技术》 2011年第1期192-193,共2页
研究维文信息检索中网页分类问题。在维文信息预处理,文档特征词组抽取和信息检索模型的建立等方面做了一些探讨。提出一种引入网页分类和词组抽取技术的信息检索方法。采用了基于KNN的网页分类方法,此方法符合雏文语言特点,能够提... 研究维文信息检索中网页分类问题。在维文信息预处理,文档特征词组抽取和信息检索模型的建立等方面做了一些探讨。提出一种引入网页分类和词组抽取技术的信息检索方法。采用了基于KNN的网页分类方法,此方法符合雏文语言特点,能够提高信息检索系统的查询准确率,使得返回结果更符合用户检索需求。 展开更多
关键词 维文网页 网页预处理 网页分类
下载PDF
垂直搜索引擎中过滤器的设计与实现 被引量:2
5
作者 梁党卫 彭文滔 边利亚 《计算机应用与软件》 CSCD 2009年第12期148-151,共4页
从海量Web资源中高效、快捷地检索信息的常规的方法是搜索引擎和信息抽取等技术,而过滤器则起着重要的Web网页预处理作用。提出了基于DOM树结构的过滤器方法,讨论了垂直搜索引擎中页面预处理的方法、设计与实现,并给出了具体的实现算法... 从海量Web资源中高效、快捷地检索信息的常规的方法是搜索引擎和信息抽取等技术,而过滤器则起着重要的Web网页预处理作用。提出了基于DOM树结构的过滤器方法,讨论了垂直搜索引擎中页面预处理的方法、设计与实现,并给出了具体的实现算法。最后结合在石油领域垂直搜索引中的具体应用,总结了过滤器适应于当前网页的结构和设计的特点,验证了方法的正确性和适用性,大大提高了垂直搜索引擎的效率和准确率。 展开更多
关键词 网页预处理 过滤器 DOM 搜索引擎
下载PDF
网络舆情分析中网页信息预处理方案的实现
6
作者 黄明锭 王嘉兴 邓成正 《中国科技期刊数据库 科研》 2019年第5期213-213,共1页
随着社会经济及科技水平的快速发展,大众对网络服务质量提出了更高要求,期望通过网页信息预处理能力,有效解决网络舆情问题。基于此,本文以网络舆情分析为切入点,就网络舆情分析中网页信息与处理方案的实现进行相关概述,旨在充分发挥出... 随着社会经济及科技水平的快速发展,大众对网络服务质量提出了更高要求,期望通过网页信息预处理能力,有效解决网络舆情问题。基于此,本文以网络舆情分析为切入点,就网络舆情分析中网页信息与处理方案的实现进行相关概述,旨在充分发挥出网页属性,建立起更加科学长效网页联系机制,切实提高数据库运行效率,以供参考。 展开更多
关键词 网络舆情 网页信息预处理方案 实现
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部