期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
使用双层分类器在垂直搜索中自动识别交互式查询接口
1
作者
王琳
王行甫
杜云开
《小型微型计算机系统》
CSCD
北大核心
2016年第6期1138-1142,共5页
一框式检索功能普遍提供于各类互联网信息门户的首页,由于需要交互式操作以及返回页面仅包含与用户所提交关键字相关的查询结果等原因,较少受到传统搜索引擎的关注.但是在垂直搜索中,若能够有效利用远程服务器自带的站内检索功能,将在...
一框式检索功能普遍提供于各类互联网信息门户的首页,由于需要交互式操作以及返回页面仅包含与用户所提交关键字相关的查询结果等原因,较少受到传统搜索引擎的关注.但是在垂直搜索中,若能够有效利用远程服务器自带的站内检索功能,将在显著降低本地计算资源和带宽消耗的同时,提高查全和查准率.提出并实现了一种用于在主题相关的页面采集过程中自动定位交互式查询接口的双层分类器.针对8个不同领域主题的规模化实验显示,该分类器能够准确过滤非相关域名和非可查表单,实现搜索接口的有效识别.
展开更多
关键词
垂直搜索
查询接口识别
表单特征分类
HTML解析
支持向量分类
决策树
下载PDF
职称材料
题名
使用双层分类器在垂直搜索中自动识别交互式查询接口
1
作者
王琳
王行甫
杜云开
机构
中国科学技术大学计算机科学与技术学院
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第6期1138-1142,共5页
基金
国家自然科学基金项目(61472382
61272472
+1 种基金
61232018)资助
国家科技重大专项项目(2012ZX10004-301-609)资助
文摘
一框式检索功能普遍提供于各类互联网信息门户的首页,由于需要交互式操作以及返回页面仅包含与用户所提交关键字相关的查询结果等原因,较少受到传统搜索引擎的关注.但是在垂直搜索中,若能够有效利用远程服务器自带的站内检索功能,将在显著降低本地计算资源和带宽消耗的同时,提高查全和查准率.提出并实现了一种用于在主题相关的页面采集过程中自动定位交互式查询接口的双层分类器.针对8个不同领域主题的规模化实验显示,该分类器能够准确过滤非相关域名和非可查表单,实现搜索接口的有效识别.
关键词
垂直搜索
查询接口识别
表单特征分类
HTML解析
支持向量分类
决策树
Keywords
deep
web
data
source
domain
-
specific
crawler
searchable
forms
html
analysis
SVM
classifier
decision
tree
algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
使用双层分类器在垂直搜索中自动识别交互式查询接口
王琳
王行甫
杜云开
《小型微型计算机系统》
CSCD
北大核心
2016
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部