-
题名基于查询向量的英语话题跟踪研究
被引量:8
- 1
-
-
作者
赵华
赵铁军
于浩
郑德权
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第8期1412-1417,共6页
-
基金
国家自然科学基金重点项目(60435020)
国家"八六三"高技术研究发展计划基金项目(2004AA117010-08)
-
文摘
通过分析英语新闻报道的特点,提出了一种基于词汇区分和位置特征相结合的特征项抽取算法.词汇区分是指将单词分为首字母是大写的单词和首字母不是大写的单词,位置特征利用新闻报道的倒金字塔式的结构特点决定单词的重要性.提出了一种基于多个特征项抽取算法融合的特征项权值计算方法,该方法认为被越多的特征项抽取算法选中的特征项越重要.提出了一种基于多数投票策略的双重过滤算法,对报道和话题是否相关进行两次过滤,大大降低了系统的误报率.实验表明提出的3种算法不但取得了很好的效果,而且具有很好的可扩展性.
-
关键词
话题跟踪
词汇区分
多数投票策略
双重过滤
归一化检测开销
-
Keywords
topic tracking
word differentiation
majority vote rule
double filtration
normalized detection cost
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于动态共现的中文话题关联检测
被引量:1
- 2
-
-
作者
庞海杰
-
机构
青岛滨海学院大专理科基础学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第3期115-117,共3页
-
基金
国家自然科学基金项目(60773034)
-
文摘
话题关联检测是话题检测与跟踪的一项子任务,是判断随机抽取的两篇新闻报道是否讨论同一个话题的技术。受词语共现模型的启发,结合话题关联检测的特点,提出了词语间的动态同现关系,实现了基于动态共现关系的报道相似度计算方法;探讨了相似度计算方法在中文话题关联检测中的应用。通过实验可知,动态共现关系可以在一定程度上反映报道的语义信息,相似度计算方法很好地改善了中文话题关联检测系统的性能,取得了不错的效果。
-
关键词
话题关联检测
话题检测与跟踪
动态共现
归一化检测开销
-
Keywords
Topic detection and tracking Dynamic co-occurrence Normalized detection cost
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于缩略语分析的中文报道关系识别研究
- 3
-
-
作者
王凤玲
-
机构
菏泽学院计算机与信息工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第18期164-166,共3页
-
文摘
分析中文缩略语的构词方式,定义2个词之间的词形相似度,提出一种基于最长字符串匹配的相似度计算方法,探讨该方法在中文报道关系识别系统中的应用。实验结果表明,该相似度计算方法能够改善中文报道关系识别系统的性能,使系统的归一化检测开销降低12.96%,取得较好的识别效果。
-
关键词
报道关系识别
话题检测与跟踪
缩略语
归一化检测开销
相似度计算方法
-
Keywords
report link recognition
topic detection and tracking
abbreviation
normalized detection cost
similarity computation method
-
分类号
N945
[自然科学总论—系统科学]
-