-
题名基于单汉字索引的全文检索系统的优化研究
被引量:11
- 1
-
-
作者
余海燕
张仲义
-
机构
北方交通大学自动化所
-
出处
《中文信息学报》
CSCD
北大核心
2001年第4期14-19,27,共7页
-
基金
86 3高技术资助项目!(86 3 - 30 6 -ZD - 0 7- 0 2 )
-
文摘
对于按照单汉字建立倒排索引的全文检索系统 ,最需要解决的问题是如何提高其存储效率和运算速度。本文针对此问题提出了以下优化方法 :一是利用参数化的Golomb编码对倒排文件进行压缩 ;二是对求集合交集的逻辑乘算法进行改进 ;三是运用并行计算和双缓冲技术。实验结果表明 ,经过优化后的单汉字全文检索系统已达到实用化的程度。
-
关键词
单汉字标引
倒排文件
Golomb编码
全文检索系统
倒排索引
单汉字索引
-
Keywords
full text retrieval
single Chinese character indexing
inverted file
Golomb coding
-
分类号
G354.45
[文化科学—情报学]
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名单汉字标引与检索技术综析
被引量:10
- 2
-
-
作者
胡盈盈
-
机构
南京大学信息管理系
-
出处
《情报理论与实践》
CSSCI
北大核心
1999年第2期137-140,共4页
-
文摘
0引言所谓单汉字标引技术,是指以单个汉字作为标引的基本单元,在检索时,对不属于停用词范畴的单个汉字进行逻辑乘运算,也即对标引字所代表的概念层面进行后组配,从而获得检索结果。作为计算机信息检索的处理对象,中文文字与西文相比,其基本语义单位———汉语词之...
-
关键词
单汉字标引
检索技术
计算机检索
-
Keywords
Indexing\ Chinese retrieval system/Single Chinese character
-
分类号
G354.4
[文化科学—情报学]
G254-39
-
-
题名单汉字标引方法的改进研究
被引量:4
- 3
-
-
作者
李培
-
机构
南开大学信息资源管理系
-
出处
《情报学报》
CSSCI
北大核心
1999年第5期416-421,共6页
-
文摘
本文根据信息论中的交互信息,给出了相邻汉字相关度的测量方法,在此基础上提出了基于字串预分割的单汉字标引检索方法,对当前具有代表性的单汉字标引方法进行了改进研究。
-
关键词
单汉字标引
字串分割
汉字标引
标引方法
计算机
-
Keywords
single Chinese character indexing,string segmentation,correlation measurement of close Chinese characters.
-
分类号
G254.36
[文化科学—图书馆学]
-
-
题名也谈单汉字标引
- 4
-
-
作者
罗雪英
-
机构
湘潭大学管理学院
-
出处
《湘潭大学社会科学学报》
2003年第B05期212-214,共3页
-
文摘
本文对单汉字标引的研究历史进行了回顾 ,对单汉字标引检索的原理进行了探讨 ,并针对如何提高单汉字标引检索的效率提出了一点看法。
-
关键词
单汉字标引
自动标引
文献标引
图书情报工作
单汉字检索
-
分类号
G254.36
[文化科学—图书馆学]
-
-
题名用FOXBASE开发单汉字标引系统
- 5
-
-
作者
金巍
-
出处
《情报科学技术》
1993年第5期12-13,49,共3页
-
-
关键词
单汉字标引
自动标引
FOXBASE
-
分类号
G254-39
[文化科学—图书馆学]
-