本文探讨加权关联模式挖掘在越英跨语言查询扩展中的应用。首先提出面向跨语言查询扩展的基于支持度-CPIR(Conditional Probability Increment Ratio)-兴趣度评价框架的加权关联模式挖掘算法(WARM-SCPIRICLQE)以及越英跨语言查询扩展模...本文探讨加权关联模式挖掘在越英跨语言查询扩展中的应用。首先提出面向跨语言查询扩展的基于支持度-CPIR(Conditional Probability Increment Ratio)-兴趣度评价框架的加权关联模式挖掘算法(WARM-SCPIRICLQE)以及越英跨语言查询扩展模型,然后提出基于词间加权关联模式挖掘的越英跨语言用户相关反馈查询扩展算法。该算法将越南语查询通过机器翻译系统翻译为英文并检索英文文档,提取前列初检文档进行用户相关性判断得到初检相关文档集,采用WARM-SCPIRI-CLQE算法对该文档集挖掘加权关联规则,从规则中提取与原查询相关的扩展词实现越英跨语言查询译后扩展。以NTCIR-5 CLIR为实验语料,将本文算法与现有算法进行实验比较,实验结果表明,本文算法能提高和改善越英跨语言信息检索性能,对长查询更有效。展开更多
文摘本文探讨加权关联模式挖掘在越英跨语言查询扩展中的应用。首先提出面向跨语言查询扩展的基于支持度-CPIR(Conditional Probability Increment Ratio)-兴趣度评价框架的加权关联模式挖掘算法(WARM-SCPIRICLQE)以及越英跨语言查询扩展模型,然后提出基于词间加权关联模式挖掘的越英跨语言用户相关反馈查询扩展算法。该算法将越南语查询通过机器翻译系统翻译为英文并检索英文文档,提取前列初检文档进行用户相关性判断得到初检相关文档集,采用WARM-SCPIRI-CLQE算法对该文档集挖掘加权关联规则,从规则中提取与原查询相关的扩展词实现越英跨语言查询译后扩展。以NTCIR-5 CLIR为实验语料,将本文算法与现有算法进行实验比较,实验结果表明,本文算法能提高和改善越英跨语言信息检索性能,对长查询更有效。