期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于条件随机场的中文科研论文信息抽取 被引量:11
1
作者 于江德 樊孝忠 尹继豪 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第9期90-94,106,共6页
科研论文头部信息和引文信息对基于域的论文检索、统计和引用分析是必不可少的.由于隐马尔可夫模型不能充分利用对抽取有用的上下文特征,因此文中提出了一种基于条件随机场的中文科研论文头部和引文信息抽取方法,该方法的关键在于模型... 科研论文头部信息和引文信息对基于域的论文检索、统计和引用分析是必不可少的.由于隐马尔可夫模型不能充分利用对抽取有用的上下文特征,因此文中提出了一种基于条件随机场的中文科研论文头部和引文信息抽取方法,该方法的关键在于模型参数估计和特征选择.实验中采用L-BFGS算法学习模型参数,并选择局部、版面、词典和状态转移4类特征作为模型特征集.在信息抽取时先利用分隔符、特定标识符等格式信息对文本进行分块,在分块基础上用条件随机场进行指定域的抽取.实验表明,该方法抽取性能明显优于基于隐马尔可夫模型的方法,且加入不同的特征集对抽取性能提升作用不同. 展开更多
关键词 信息抽取 条件随机场 引文信息 论文头部信息
下载PDF
基于隐马尔可夫模型的中文科研论文信息抽取 被引量:9
2
作者 于江德 樊孝忠 +1 位作者 尹继豪 顾益军 《计算机工程》 CAS CSCD 北大核心 2007年第19期190-192,共3页
随着大量的科研论文出现在互联网上,从中精确地抽取论文头部信息和引文信息显得十分重要。该文提出了一种基于隐马尔可夫模型的中文科研论文头部信息和引文信息抽取算法,分析了模型结构的学习和参数估计方法。在进行信息抽取时,利用分... 随着大量的科研论文出现在互联网上,从中精确地抽取论文头部信息和引文信息显得十分重要。该文提出了一种基于隐马尔可夫模型的中文科研论文头部信息和引文信息抽取算法,分析了模型结构的学习和参数估计方法。在进行信息抽取时,利用分隔符、特定标识符等格式信息对文本进行分块,利用隐马尔可夫模型进行指定域的抽取。实验结果表明,该算法具有良好的准确率和召回率。 展开更多
关键词 隐马尔可夫模型 信息抽取 论文头部信息
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部