基于用户本体模型的文本信息过滤方法研究

ON METHOD OF TEXT INFORMATION FILTERING BASED ON USER ONTOLOGY MODEL

下载PDF

导出

摘要随着互联网信息的快速剧增,文本过滤技术成为互联网内容处理的关键技术,对海量信息处理具有很重要的意义。目前研究热点是基于语义的过滤方法,但是这些方法一般都需要大量规则和领域知识的支持,可用性不是很好。为了使机器更好地理解用户需求和文本内容,使过滤结果更能反映用户的真正需求,提高文本过滤的准确率和召回率,提出了基于用户本体模型UOM的文本信息过滤方法。该方法主要包括UOM构建、文本结构分析、文本概念提取和语义相关度计算等。基于UOM(User Ontology Model)的过滤方法,不仅可以表示复杂的用户需求,而且还避免了领域本体的构建,因而其有效性和实用性得到了很大的提高。通过在网络教学资源的智能按需服务系统中的实际运用,表明此方法能更有效地为用户提供过滤服务。 With dramatic increase of information on Internet, text filtering becomes a key technology in Internet content processing and is of important in huge information processing. Now the filtering methods based on semantics are researchers＇ focus, however the usability of these methods is not good, because they must be supported by plentiful rules and domain knowledge. To improve filtering precision and recall rates, in this paper it presents a novel method for text information filtering based on User Ontology Model （ UOM）, so that the machines could understand better the user＇ s requirements and text content to some extent, and the filtering results could reflect users＇ requirements more. The method includes UOM model building, text structure analysis, text conception extracting and semantic correlation computing, and so on. The filtering method based on UOM can express the complex requirements and also avoids building domain ontology, so its effectiveness and practicality have had a great promotion. This method is applied to the system of intelligent on-demand services for interact teaching resource and is shown that it can provide filtering services to users effectively.

作者刘中原张博锋潘建国王洋

机构地区上海大学计算机工程与科学学院

出处《计算机应用与软件》 CSCD 2009年第5期43-45,84,共4页 Computer Applications and Software

基金国家自然科学基金重大研究计划(90612010)

关键词文本过滤用户本体模型虚关系文本结构分析 Text filtering User ontology model Virtual relationship Text structure analysis

分类号 TP393.098 [自动化与计算机技术—计算机应用技术] TP391 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献7

1晋耀红.基于语义的文本过滤系统的设计与实现[J].计算机工程与应用,2003,39(17):22-25. 被引量：18
2袁兴宇,王挺,周会平,肖君.以本体构造中文信息过滤中的需求模型[J].中文信息学报,2006,20(3):63-69. 被引量：4
3曾春..信息过滤的概念表示与算法研究[D].清华大学,2003:
4晋耀红,苗传江.一个基于语境框架的文本特征提取算法[J].计算机研究与发展,2004,41(4):582-586. 被引量：15
5林鸿飞.基于混合模式的文本过滤模型[J].计算机研究与发展,2001,38(9):1127-1131. 被引量：22
6陈晓明,王虹,张仰森.“知网”的知识扩展和推理研究[J].贵州大学学报（自然科学版）,2001,18(2):97-102. 被引量：2
7王洪伟,吴家春,蒋馥.基于描述逻辑的本体模型研究[J].系统工程,2003,21(3):101-106. 被引量：38

二级参考文献31

1董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量：59
2黄曾阳.HNC（概念层次网络）理论[M].北京:清华大学出版社,1998.. 被引量：22
3姚天顺.自然语言理解[M].南宁:广西科技出版社,1997.. 被引量：1
4颜国伟谭慧敏.基于知网语料标注手册[M].,.. 被引量：1
5晋耀红.HNC句类分析系统[M].武汉：武汉理工大学出版社,2001.. 被引量：1
6王洪伟吴家春蒋馥.本体的形式化模型及在语义查询中的应用[A]..Advances of search engine and web mining in China(搜索引擎与Web挖掘进展)[C].北京:高等教育出版社,2003.205～213. 被引量：1
7[1]Anselm Spoerri. A visual tool for information retrieval. 1995. http://www.scils.rutgers.edu/～aspoerri/InfoCrystal 被引量：1
8[3]S Robertson. The TREC 2001 Filtering Track Report. 2001. http://trec.nist.gov/pubs/trec10/t10- proceedings.html 被引量：1
9Gruber T R. Ontolingua:a translation approach to portable ontology specifications[J]. Knowledge Acquisition,1993,5(2):199-220. 被引量：1
10Guarino N. Formal ontologies and information systems[A]. Guarino N. Formal ontology in information systems,proceedings of FOIS' 98[C]; Amsterdam :IOS Press, 1998 : 3- 17. 被引量：1

共引文献89

1王洪伟,蒋馥,吴家春.An Extended Ontology Model and Ontology Checking Based on Description Logics[J].Journal of Shanghai Jiaotong university(Science),2004,9(1):34-41. 被引量：8
2王洪伟,蒋馥,吴家春.简单本体的形式化模型及包含性检验[J].系统工程理论方法应用,2004,13(3):193-198. 被引量：2
3张克亮.基于HNC理论的句法结构歧义消解[J].中文信息学报,2004,18(6):43-52. 被引量：9
4王洪伟,蒋馥,侯立文.面向语义的元数据模型的工程化创建方法[J].情报科学,2005,23(1):95-101. 被引量：1
5汪方胜,侯立文,蒋馥.领域本体建立的方法研究[J].情报科学,2005,23(2):241-244. 被引量：43
6汪方胜,侯立文,蒋馥.基于本体和相似度的信息检索[J].图书情报工作,2005,49(2):61-63. 被引量：1
7王太雷.基于相似模式聚类的电子商务网站个性化推荐系统研究[J].计算机工程与应用,2005,41(6):152-157. 被引量：6
8李文斐,吴兴华.提升执行能力:部门经理的成功所在[J].人才资源开发,2005(4):29-30.
9田春虎.国内语义Web研究综述[J].情报学报,2005,24(2):243-249. 被引量：37
10王太雷.个性化推荐系统中相似模式聚类研究[J].计算机工程,2005,31(10):156-158. 被引量：3

1王琦,王敬杰.演绎数据库虚关系的内部表示[J].太原科技,2003(5):50-51.
2唐晓文.基于本体论的文本特征提取[J].电脑与信息技术,2005,13(1):36-38. 被引量：11
3张殿勇.互联网内容识别和中文文本信息过滤——互联网监管系统设计实现[J].辽宁行政学院学报,2003,5(3):88-89.
4徐洁磐.关于在演绎数据库系统研究中引入一种新的关系的一些探讨[J].软件学报,1994,5(12):17-23. 被引量：1
5刘军万,刘飞飞.基于潜在语义索引的文本结构分析方法的研究[J].情报杂志,2004,23(1):56-58. 被引量：4
6林鸿飞,战学刚,姚天顺.基于概念的文本结构分析方法[J].计算机研究与发展,2000,37(3):324-328. 被引量：35
7让企业远离“僵尸网络”的五则安全技巧[J].计算机与网络,2010(11):39-39.
8林鸿飞,战学刚,姚天顺.文本结构分析与基于示例的文本过滤[J].小型微型计算机系统,2000,21(4):422-425. 被引量：23
9苏绥,林鸿飞,叶正.基于字符语言模型的垃圾邮件过滤[J].中文信息学报,2009,23(2):41-47. 被引量：8
10阮冰.基于特征向量的文本信息过滤算法研究[J].现代电子技术,2010,33(4):145-147.

计算机应用与软件

2009年第5期

浏览历史

内容加载中请稍等...

基于用户本体模型的文本信息过滤方法研究

参考文献7

二级参考文献31

共引文献89

相关作者

相关机构

相关主题

浏览历史