-
题名Web Track 2003技术报告
- 1
-
-
作者
杨哲
程学旗
王斌
-
机构
中国科学院计算技术研究所软件研究室
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第33期126-128,183,共4页
-
基金
国家973基础科学研究计划资助(编号:G1998030413)
-
文摘
文本检索会议(Trec)是信息检索领域一年一度的学术交流和系统评测活动,本届Trec的WebTrack任务由命名网页发现/主页发现子任务和主题提取子任务组成。笔者在上届Trec的基础上,根据不同的子任务的需求,使用了不同的方法。在命名网页发现子任务中,锚文本、网页标题与网页内容是最重要的资源,而Ulr的目录层数对主页发现子任务中主页的判别有重要作用。多检索系统的投票机制,能大幅提高主题提取子任务的性能。
-
关键词
文本检索会议
命名网页发现
主页发现
主题提取
多检索系统投票机制
-
Keywords
Text Retrieval Conference,named page finding,home page finding,topic distillation,multiple systems vote mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-