-
题名基于网络日志的用户兴趣模型构建
被引量:8
- 1
-
-
作者
段建勇
魏晓亮
张梅
徐骥超
-
机构
北方工业大学信息工程学院
-
出处
《情报科学》
CSSCI
北大核心
2013年第9期78-82,共5页
-
基金
国家社会科学基金项目(11CTQ036)
国家自然科学基金项目(61103112)
教育部人文社会科学青年基金项目(10YJC870003)
-
文摘
了解用户查询意图对改善搜索引擎质量起到了至关重要的作用,对具有特定兴趣的用户进行查询分析,使搜索引擎更能了解用户的真实需求。本文通过对网络查询日志进行聚类分析,将相似度大的查询词聚类,建立用户兴趣模型对用户的兴趣进行分析。根据查询词内容重合度,建立查询词图,并结合查询词的PageRank算法,提出一种基于用户查询词概率分布的评价方法,对用户感兴趣的查询词进行评价。最后,根据查询词的概率分布将最感兴趣的查询词推荐给用户。
-
关键词
查询日志
兴趣模型
个性化推荐
-
Keywords
query log
interest model
personalized recommendation
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于网络日志的知识地图构建与应用
被引量:3
- 2
-
-
作者
张梅
段建勇
徐骥超
-
机构
北方工业大学信息工程学院
-
出处
《图书情报工作》
CSSCI
北大核心
2012年第18期117-121,共5页
-
基金
国家社会科学基金项目"基于网络日志的知识地图构建及其应用研究"(项目编号:11CTQ036)
教育部人文社会科学基金青年项目"属性知识在复合结构语义分析中的应用研究"(项目编号:10YJC740132)研究成果之一
-
文摘
通过分析网络日志获得查询聚类和会话单元数据集,在此基础上提出知识地图构造算法,对学习到的知识进行存储与管理,构建基于网络日志的知识地图,利用知识地图中的查询知识可以进行知识的筛选,将查询知识展示在用户面前,使用户快速地获得需要的查询知识。
-
关键词
知识地图
网络日志
随机游走
会话单元
-
Keywords
knowledge map
Web log
random walk
session
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP311.13
[自动化与计算机技术—计算机科学与技术]
-
-
题名网络日志中查询串语义关系挖掘及其应用研究
被引量:2
- 3
-
-
作者
段建勇
徐骥超
张梅
-
机构
北方工业大学信息工程学院
-
出处
《现代图书情报技术》
CSSCI
北大核心
2012年第1期58-62,共5页
-
基金
国家社会科学基金项目“基于网络日志的知识地图构建及其应用研究”(项目编号:11CTQ036),国家自然科学基金项目“面向维基百科的多粒度一体化信息抽取方法研究”(项目编号:61103112)
教育部人文社会科学青年基金项目“基于多层次情感分析的网络文本舆情监测方法研究”(项目编号:10YJC870003)
国家语委十二五规划基金项目“基于概念与属性约束的语义知识自动获取及其应用研究”(项目编号:YB125-10)的研究成果之一
-
文摘
通过挖掘网络日志中的查询词语义关系,将《知网》的语义知识加入到聚类算法中实现搜索引擎优化。该方法通过机器学习算法深入挖掘查询日志,对其中的查询串进行概念相似度、语义聚类等计算,使返回网页更加合理,将更准确的网页结果呈现在用户面前,能够更好地满足用户需求。
-
关键词
网络日志
优化算法
网络挖掘
-
Keywords
Web log Optimization algorithm Web mining
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名人名属性知识挖掘及其在查询分类中的应用
被引量:1
- 4
-
-
作者
张梅
段建勇
徐骥超
-
机构
北方工业大学信息工程学院
-
出处
《现代图书情报技术》
CSSCI
北大核心
2013年第9期82-87,共6页
-
基金
国家社会科学基金项目"基于网络日志的知识地图构建及其应用研究"(项目编号:11CTQ036)
国家自然科学基金项目"面向维基百科的多粒度一体化信息抽取方法研究"(项目编号:61103112)
教育部人文社会科学基金项目"属性知识在复合结构语义分析中的应用研究"(项目编号:10YJC740132)的研究成果之一
-
文摘
网络日志中存在大量的命名实体类查询,而其中人名查询占到近半的比例。提出运用网络查询日志和维基百科知识构建人名知识库,并应用于查询分类。通过抽取查询日志中的人名实体,并结合百科知识充实实体属性知识,形成包含属性知识的人名知识库。根据高质量的属性模板和统计分类方法对查询中的人名进行分类,在查询推荐中依据不同人物分类知识库进行分类推荐。实验结果表明该知识库对查询串中的人名实体能进行有效分类。
-
关键词
属性挖掘
查询分类
信息检索
-
Keywords
Attribute mining Query classification Information retrieval
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-