期刊文献+

名人网页的相关度评价 被引量:9

The Relevance Evaluation of the Celebrities' WebPages
下载PDF
导出
摘要 本文介绍了北京大学天网知名度系统的设计与开发工作,重点论述了中文名人网页相关度评价的因素、算法和相应的检索结果。针对目前搜索引擎服务的不足之处,该工作旨在改进网上信息服务的质量,提高个性化网上信息服务的能力。本系统在北京大学天网搜索引擎的基础上,利用自然语言处理、特别是中文信息提取的新技术,结合网页信息的特点,针对名人网页的检索提出了一种新的网页相关度评价算法,改善了检索结果排序的合理性,提高了名人网页检索服务的质量。 This paper introduced the design and implementation of Tianwang Fame System. It mainly discussed on the factors and algorithms that affect matching of a named entity with Chinese webpages' relevance evaluation on the celebrities. Aiming at shortages of the current Search Engines, the project is to improve the quality of the web information services, and to enhance the ability of the personalizing services. Based on the Tianwang Search Engine of Peking University, the Fame System adopted new techniques in Nature Language Processing, especially in Chinese information extraction according to the features of webpage information. The paper proposed a new method to the relevance evaluation of webpages against attributes of named enties. This method optimizes the order of the search results, and improves the service quality of Tianwang Fame System.
出处 《中文信息学报》 CSCD 北大核心 2003年第5期27-33,共7页 Journal of Chinese Information Processing
基金 国家自然科学基金资助项目(69973005) 863资助项目(2001AA14040) 北大-IBM创新研究院资助项目
关键词 计算机应用 中文信息处理 相关度 检索服务 信息提取 特征信息 computer application Chinese information processing relevance searching service information extraction feature information
  • 相关文献

参考文献10

  • 1孙斌.中文信息提取系统设计与若干相关基础问题的研究[R].北京大学博士后研究工作报告,2002.5. 被引量:1
  • 2冯是聪.搜索引擎个性化查询服务研究[R].北京大学博士生开题报告(电子版),2002.6. 被引量:1
  • 3施水才 肖诗斌 等.TSR中文文本信息检索技术的发展[A]..中国中文信息学会二十周年学术会文论文集[C].清华大学出版社,2001,11.(79—88). 被引量:1
  • 4昝红英,俞士汶.CCD及其应用[J].广西师范大学学报(自然科学版),2003,21(A01):98-103. 被引量:7
  • 5Dayne Freitag. Information Extraction from HTML: Application of a General Machine Learning Approach. American Association for Artificial Intelligence (www. aaai. org). 1998. 被引量:1
  • 6A. Douthat. The Message Understanding Conference Scoring Software User's Manual. MUC- 7 Proceedings. SAIC 1999. 被引量:1
  • 7S. Chakrabarti, B. E. Dom, et al. Mining the web's link structure. COMPUTER, 1999,32:60-67. 被引量:1
  • 8J. M. Kleinberg. Authoritative sources in a hyperlinked environment. Journal of ACM, 1999,46:604 -632. 被引量:1
  • 9Jiawei Han, Micheline Kamber. Data Mining-Concept and Tachniques. Academic Press, 2000. 被引量:1
  • 10Ray, Deborah S. Mastering Html 4.0 1998. 被引量:1

二级参考文献1

  • 1刘扬,俞士汶.CCD构造模型及VACOL辅助软件的设计与实现[A]第一届学生计算语言学研讨会论文集,2002. 被引量:1

共引文献6

同被引文献111

引证文献9

二级引证文献41

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部