-
题名开源中文分词器在web搜索引擎中的应用
被引量:12
- 1
-
-
作者
刘晓婉
胡燕祝
艾新波
-
机构
北京邮电大学电子工程学院
北京邮电大学自动化学院
-
出处
《软件》
2013年第3期80-83,共4页
-
文摘
目前,在信息检索方面,一般分词器对英文的支持相对较好,但对中文分词效果不太理想;随着web搜索在互联网中的广泛应用,中文分词器也出现了突飞猛进的发展,尤其以IKAnalyzer分词器为主的分词工具,为更多企事业单位所采纳。本文主要在词条化等方面对分词原理进行深入的分析,并且对如何构造智能分词词典进行了探讨。同时,对分词内部结构进行研究,在分词数目和速率方面对目前主流的中文分词器进行了比较,并运用htmlparser库对北京邮电大学的网站进行解析,采用分词工具Paoding Analysis建立索引文件存入本地,利用solt4.0全文搜索服务器给出运用中文分词后的查询效果图,实现对北京邮电大学网站的全文搜索功能。
-
关键词
分词器
WEB搜索
信息检索
智能分词
全文搜索
-
Keywords
Information Retrieval
Tokenizer
Web search
intelligent words segmentation
full text Search
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名数字苏州公共服务平台的构建
被引量:1
- 2
-
-
作者
高苏新
-
机构
苏州市规划编制信息中心
-
出处
《测绘与空间地理信息》
2011年第3期24-26,共3页
-
基金
此平台列为2009江苏省"333高层次人才培养工程"专项资助项目(编号18)资助
-
文摘
结合苏州市地理信息系统平台建设实际情况,分别从建设目标、技术设计,系统开发、共享模式和应用推广等方面总结了数字苏州市公共服务平台建设的思路与经验,同时也提出了当前推广地理信息系统应用集成开发的创新思想。
-
关键词
公共服务平台
地图服务引擎
智能分词
函数接口
项目18数字苏州公共服务平台
-
Keywords
public service platform
map service engine
intelligent word segmentation
function interface
digital Suzhou public service platform
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-