-
题名Web文本信息的特征获取算法
被引量:27
- 1
-
-
作者
刘明吉
王秀峰
饶一梅
黄亚楼
-
机构
南开大学计算机与系统科学系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2002年第6期683-686,共4页
-
基金
天津自然科学技术基金项目 (0 0 3 70 0 111)
(993 60 0 811)和 (0 0 3 60 0 3 11)资助
-
文摘
Internet的发展为人们提供了大量的信息资源 ,Web文本挖掘是从非结构化的文本中发现潜在的、有价值知识的一种有效技术 .本文以矢量空间模型为 Web文本的表示方法 ,提出了一个基于遗传算法的 Web文本特征抽取算法 ,进一步提高了 Web文本的处理效率 ,为文本的分类、聚类以及其它处理提供了简练的特征表示方法 .实验证明 ,该种处理方法有效地降低了文本特征矢量的维数 .
-
关键词
WEB
文本信息
特征获取算法
遗传算法
INTERNET
WWW
-
Keywords
Web mining
VSM
genetic algorithm
text feature abstract
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于协同演化的文本特征获取算法
被引量:3
- 2
-
-
作者
刘明吉
-
机构
中国证券登记结算有限责任公司上海分公司
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第4期85-87,共3页
-
文摘
作为证券监管机构,如何从海量的网络信息中有效地对文本信息进行准确的分类,对于提高日常监管工作效率是非常重要的。该文主要基于数据挖掘技术,以矢量空间模型VSM为文本的表示方法,提出了一个基于协同演化遗传算法的多文本特征抽取算法,有效地降低了文本特征矢量的维数,为文本分类模板获取等多文本特征获取问题提供了一个可行的解决方案。
-
关键词
协同演化
VSM
遗传算法
文本特征抽取
-
Keywords
Cooperativeevolution
VSM
Genetic algorithm
text feature abstract
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-