-
题名基于多示例学习技术的Web目录页面链接推荐
被引量:6
- 1
-
-
作者
薛晓冰
韩洁凌
姜远
周志华
-
机构
南京大学软件新技术国家重点实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第3期406-411,共6页
-
基金
国家自然科学基金项目(60505013)
江苏省自然科学基金项目(BK2005412)
国家"九七三"重点基金研究发展规划基金项目(2002CB312002)
-
文摘
在Web目录页面中,向用户推荐其感兴趣的链接有助于用户高效地访问网络资源.然而,用户往往不愿花费很多时间来标记训练样本,其提供的数据可能只能说明某个目录网页是否包含其感兴趣的内容,而不能明确标示出其感兴趣的具体链接.由于训练数据中缺乏对链接的标记,但预测时却需要找出用户感兴趣的链接,这就使得Web目录页面链接推荐问题相当困难.CkNN-ROI算法被提出用于解决该问题.实验表明,CkNN-ROI算法在解决这一困难的链接推荐问题上比其他一些算法更为有效.
-
关键词
多示例学习
机器学习
数据挖掘
web挖掘
链接推荐
web目录页面
-
Keywords
multi-instance learning
machine learning
data mining
web mining
link recommendation
web index page
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于多示例学习的中文Web目录页面推荐
被引量:17
- 2
-
-
作者
黎铭
薛晓冰
周志华
-
机构
南京大学计算机软件新技术国家重点实验室
-
出处
《软件学报》
EI
CSCD
北大核心
2004年第9期1328-1335,共8页
-
基金
国家自然科学基金
国家杰出青年科学基金
国家重点基础研究发展规划(973)~~
-
文摘
多示例学习为中文 Web 挖掘提供了一种新的思路.提出中文 Web 目录页面推荐这种特殊的 Web 挖掘任务,并且将其转化为多示例学习问题来解决.在真实世界数据集上的实验结果显示,该方法能够有效地解决该问题.
-
关键词
多示例学习
web挖掘
机器学习
中文web目录页面推荐
前缀树
-
Keywords
Algorithms
Data mining
Database systems
Feature extraction
Learning systems
Trees (mathematics)
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-