期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
搜索日志中命名实体识别
1
作者
任育伟
吕学强
+1 位作者
李卓
徐丽萍
《现代图书情报技术》
CSSCI
2015年第6期49-56,共8页
【目的】搜索日志中命名实体识别对于优化搜索意图,提高搜索引擎服务质量存在重要意义。【方法】利用种子命名实体和模板匹配原则抽取候选命名实体并聚类,聚类后进行候选命名实体识别特征抽取,包括频次、不同模板数、模板权重特征。融...
【目的】搜索日志中命名实体识别对于优化搜索意图,提高搜索引擎服务质量存在重要意义。【方法】利用种子命名实体和模板匹配原则抽取候选命名实体并聚类,聚类后进行候选命名实体识别特征抽取,包括频次、不同模板数、模板权重特征。融合这些特征构造命名实体识别权重计算公式,并合理调整特征影响参数。【结果】对根据权重提取的命名实体进行标注和统计,发现P@500值平均达到75%左右,比Pa@ca方法高出7%。【局限】对模板敏感性弱的命名实体不能精确抽取。【结论】通过计算该方法抽取结果指标P@N值,并和其他方法抽取结果指标进行比较,证明该方法的有效性。
展开更多
关键词
搜索日志
模板
权重
类
K-MEANS聚
类
特征
权重
种子命名实体
原文传递
题名
搜索日志中命名实体识别
1
作者
任育伟
吕学强
李卓
徐丽萍
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京城市系统工程研究中心
出处
《现代图书情报技术》
CSSCI
2015年第6期49-56,共8页
基金
国家自然科学基金项目"基于本体的专利自动标引研究"(项目编号:61271304)
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目"面向领域的互联网多模态信息精准搜索方法研究"(项目编号:KZ201311232037)的研究成果之一
文摘
【目的】搜索日志中命名实体识别对于优化搜索意图,提高搜索引擎服务质量存在重要意义。【方法】利用种子命名实体和模板匹配原则抽取候选命名实体并聚类,聚类后进行候选命名实体识别特征抽取,包括频次、不同模板数、模板权重特征。融合这些特征构造命名实体识别权重计算公式,并合理调整特征影响参数。【结果】对根据权重提取的命名实体进行标注和统计,发现P@500值平均达到75%左右,比Pa@ca方法高出7%。【局限】对模板敏感性弱的命名实体不能精确抽取。【结论】通过计算该方法抽取结果指标P@N值,并和其他方法抽取结果指标进行比较,证明该方法的有效性。
关键词
搜索日志
模板
权重
类
K-MEANS聚
类
特征
权重
种子命名实体
Keywords
Search log Template weight K-means clustering Feature weight Seed named entity
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
搜索日志中命名实体识别
任育伟
吕学强
李卓
徐丽萍
《现代图书情报技术》
CSSCI
2015
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部