期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于关键词聚类和节点距离的网页信息抽取 被引量:8
1
作者 邓健爽 郑启伦 +1 位作者 彭宏 林旭东 《计算机科学》 CSCD 北大核心 2007年第4期213-216,共4页
大部分网页信息抽取方法都针对特定的网站,例如基于网站抽取规则和基于训练网页样例的方法。这些方法在某一个网站上可以很好地应用。但当遇到新的网站时,必须人为地增加抽取规则或者提供新的训练网页集。而且,当网站的模版改变时,也要... 大部分网页信息抽取方法都针对特定的网站,例如基于网站抽取规则和基于训练网页样例的方法。这些方法在某一个网站上可以很好地应用。但当遇到新的网站时,必须人为地增加抽取规则或者提供新的训练网页集。而且,当网站的模版改变时,也要重新设计这些规则或重新输入训练网页集。这些方法难以维护,因此不能应用到从大量不同的网站上进行信息抽取。本文提出了一种新的网页信息抽取方法,该方法基于特定主题的关键词组和节点距离,能够不加区分地对不同的网站页面信息自动抽取。对大量网站的网页进行信息抽取的实验显示,该方法能够不依赖网页的来源而正确和自动地抽取相关信息,并且已经成功应用到电子商务智能搜索和挖掘系统中。 展开更多
关键词 聚类 信息抽取 机器学习 节点距离
下载PDF
基于搜索引擎的关键词自动聚类法 被引量:2
2
作者 邓健爽 郑启伦 +1 位作者 彭宏 邓维维 《计算机科学》 CSCD 北大核心 2007年第3期162-164,共3页
互联网为用户提供了一个丰富的信息平台。然而,当前人们对互联网中海量信息的利用主要通过搜索引擎去查询相关的信息,互联网只是作为一个简单的信息库供用户检索。本文研究通过搜索引擎获得互联网信息并且在此基础上进行更高层次的知识... 互联网为用户提供了一个丰富的信息平台。然而,当前人们对互联网中海量信息的利用主要通过搜索引擎去查询相关的信息,互联网只是作为一个简单的信息库供用户检索。本文研究通过搜索引擎获得互联网信息并且在此基础上进行更高层次的知识挖掘———基于搜索引擎对关键词进行自动聚类。这是一个全新的研究,实验结果表明该方法具有理想的效果和新颖的构思。 展开更多
关键词 知识搜索引擎 知识挖掘 聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部