期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
11
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
从文本到事件:论扎西才让小说的事件之维
1
作者
胡亚蓉
《兰州文理学院学报(社会科学版)》
2024年第5期18-22,共5页
扎西才让的小说在整体上表现为处在不断生成、变化中的文学事件。循着从文本到事件的研究路径,从创作事件、文本事件、阅读事件三个层面入手,可以发现扎西才让小说作品中,作家的个体经验与以桑多藏地为代表的生活事件的有机交融,为扎西...
扎西才让的小说在整体上表现为处在不断生成、变化中的文学事件。循着从文本到事件的研究路径,从创作事件、文本事件、阅读事件三个层面入手,可以发现扎西才让小说作品中,作家的个体经验与以桑多藏地为代表的生活事件的有机交融,为扎西才让创造一个文学“桑多”世界打下坚实基础。与此同时,扎西才让小说文本借助言语行为的建构功能聚焦普通人鲜活、脆弱的生命体验,有助于阅读者将经由文字和语言表达出来的“世界”进行调整、重塑和再阐释,为阅读感受和小说意义的生成打开更多可能,使扎西才让小说始终向现实世界敞开。
展开更多
关键词
扎西才让
文学事件
创作事件
文本事件
阅读事件
下载PDF
职称材料
数字视频中字幕检测及提取的研究和实现
被引量:
16
2
作者
蔡波
周洞汝
胡宏斌
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2003年第7期898-903,共6页
首先进行文字事件检测 ,然后进行边缘检测、阈值计算和边缘尺寸限制 ,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕 提出的叠加水平和垂直方向边缘的方法 ,加强了检测到的文字的边缘 ;对边缘进行尺寸限制过滤掉了不符合文...
首先进行文字事件检测 ,然后进行边缘检测、阈值计算和边缘尺寸限制 ,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕 提出的叠加水平和垂直方向边缘的方法 ,加强了检测到的文字的边缘 ;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘 ;进一步 ,提出像素密度α的概念 ,并指出文字区域的像素密度α应在某一阈值范围之内 (αmin≤α≤αmax) 通过像素密度α滤去了非文字区域 ,应用投影法最终确定视频字幕所在区域 以上方法的结合保证了提出的算法的正确率和鲁棒性 选用不同类型的视频素材对文中算法进行实验 ,并与其他方法进行比较 。
展开更多
关键词
数字视频
字幕检测
像素密度
鲁棒性
文字提取
下载PDF
职称材料
利用OCR识别技术实现视频中文字的提取
被引量:
22
3
作者
陈义
李言俊
孙小炜
《计算机工程与应用》
CSCD
北大核心
2010年第10期180-183,共4页
为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方...
为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方法,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘。应用投影法最终确定视频字幕所在区域。最后,利用OCR识别技术对提取出来的文字区域进行识别,完成视频中文字的提取。以上方法的结合保证了提出算法的正确率和鲁棒性。
展开更多
关键词
光学文字识别
文字事件检测
数字视频
下载PDF
职称材料
融合事件类型的中文事件抽取方法
4
作者
王瑾睿
李劼
《计算机工程与应用》
北大核心
2025年第1期214-220,共7页
事件抽取技术是自动化地从文本信息中获得结构性数据的重要手段,也是自然语言处理领域的重点研究方向之一。事件抽取包含两个子任务,事件类型检测与事件论元抽取。近年来的事件抽取研究引入了预训练语言模型作为文本的语义表征,然后采...
事件抽取技术是自动化地从文本信息中获得结构性数据的重要手段,也是自然语言处理领域的重点研究方向之一。事件抽取包含两个子任务,事件类型检测与事件论元抽取。近年来的事件抽取研究引入了预训练语言模型作为文本的语义表征,然后采用序列标注BIO完成抽取任务,但此类方法容易存在标签歧义问题。因此又有学者提出在事件文本特征中融入特征知识以避免歧义,可现有的融合方法忽略了事件抽取各个子任务间的依赖关系。为解决以上问题,针对事件抽取任务采用联合学习的算法框架,通过门融合机制将事件类型信息作为新知识融入事件的文本表示中,再进行事件触发词抽取与事件论元抽取。实验结果证明该算法模型在论元抽取任务上较之基线方法表现更优异。
展开更多
关键词
文本事件抽取
预训练语言模型
门融合
非压缩域数字视频中文字的检测与提取
被引量:
1
5
作者
高平利
任金昌
赵荣椿
《中国体视学与图像分析》
2004年第4期244-248,共5页
作为一种高级语义特征 ,视频中的文字信息对视频内容的理解、索引和检索具有重要意义。本文针对非压缩域中视频文字的检测与提取技术做了详尽的分析和讨论 ,涉及的内容包括 :文字事件的检测、帧图像中文字区域的检测与分割以及视频文字...
作为一种高级语义特征 ,视频中的文字信息对视频内容的理解、索引和检索具有重要意义。本文针对非压缩域中视频文字的检测与提取技术做了详尽的分析和讨论 ,涉及的内容包括 :文字事件的检测、帧图像中文字区域的检测与分割以及视频文字识别 (VideoOCR)等。对于不同的典型算法 ,分析了其理论基础和应用特点 ,并且通过对比指出其不足和应用的局限。最后 ,本文还展望了该技术未来发展的方向。
展开更多
关键词
非压缩域
文字事件检测
文字分割与识别
视频索引与检索
下载PDF
职称材料
基于知识分层提取模型的服务台知识库建设
被引量:
3
6
作者
曹逸峰
陈晓伟
《计算机系统应用》
2015年第2期261-265,共5页
针对传统运维知识库建设的不足,提出了一种面向服务台的生产运维知识自动分层提取模型.通过建立生产运维特征词库,对事件工单的短文本进行向量化解析,并利用改进的KNN算法实现事件短文本分类,最终通过领域主题规则完成知识的发现.将此...
针对传统运维知识库建设的不足,提出了一种面向服务台的生产运维知识自动分层提取模型.通过建立生产运维特征词库,对事件工单的短文本进行向量化解析,并利用改进的KNN算法实现事件短文本分类,最终通过领域主题规则完成知识的发现.将此方法应用到企业级服务台知识库建设中,完成了由事件工单到知识的自动转化,弥补了手工创建知识的缺陷,促进了整个运维流程的自动化.
展开更多
关键词
运维知识库
服务台
事件短文本
特征向量
KNN算法
下载PDF
职称材料
以事件为特征的文本聚类方法
被引量:
1
7
作者
王崇国
《计算机应用与软件》
CSCD
2010年第8期195-197,共3页
文本聚类是聚类的一个重要的研究分支,是聚类方法在自然语言处理领域的具体应用。研究表明事件在大量的文本中是客观存在的,诸多文本是由事件组成的,事件是文本表示的最小语义单位。探讨了以事件为特征的文本聚类方法,首先给出了基于事...
文本聚类是聚类的一个重要的研究分支,是聚类方法在自然语言处理领域的具体应用。研究表明事件在大量的文本中是客观存在的,诸多文本是由事件组成的,事件是文本表示的最小语义单位。探讨了以事件为特征的文本聚类方法,首先给出了基于事件的文本概念格表示模型,在此模型的基础上,给出了文本相似度的计算方法。最后,使用K-means聚类算法对所提方法进行了实验验证。
展开更多
关键词
文本聚类
事件
文本相似度
概念格
下载PDF
职称材料
卡拉OK字幕的检测与定位
8
作者
陈文婷
李磊
杨盈昀
《中国传媒大学学报(自然科学版)》
2008年第2期71-76,共6页
本文针对视频序列文字的检测与提取技术做了详尽的分析和讨论,内容包括:文字事件的检测、帧图像中文字区域的检测与定位。首先进行文字事件检测,然后进行边缘检测,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸...
本文针对视频序列文字的检测与提取技术做了详尽的分析和讨论,内容包括:文字事件的检测、帧图像中文字区域的检测与定位。首先进行文字事件检测,然后进行边缘检测,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘;进一步,提出像素密度δ的概念,并指出文字区域的像素密度δ应在某一阈值范围之内(δmin<δ<δmax)。通过像素密度δ滤去了非文字区域,应用投影法最终确定视频字幕所在区域。
展开更多
关键词
文字事件检测
数字视频
字幕检测及提取
边缘检测
纹理能量
全方位像素膨胀
下载PDF
职称材料
中文文本事件检测技术
9
作者
崔莹
《计算机与数字工程》
2022年第12期2700-2704,共5页
随着深度学习的发展,神经网络在文本检测方面得到了更深入的研究和更广泛的应用。在此基础上,为了提升中文文本事件检各项性能,提出了一种基于改进神经网络的中文文本事件检测方法,研究利用FPA算法优化传统BP神经网络的权值和阈值。为...
随着深度学习的发展,神经网络在文本检测方面得到了更深入的研究和更广泛的应用。在此基础上,为了提升中文文本事件检各项性能,提出了一种基于改进神经网络的中文文本事件检测方法,研究利用FPA算法优化传统BP神经网络的权值和阈值。为了验证基于改进神经网络的中文文本事件检测方法的效果,将其与自然场景文本检测方法在召回率、准确率和耗时性等方面进行了比较。结果表明:自然场景文本检测方法的准确率为88%,召回率为73%;基于改进神经网络的文本检测方法准确率为95%,召回率为86%;中文文本事件检测测试中自然场景文本检测方法的F值为0.79,耗时4.56s;基于改进神经网络的文本检测方法的F值为0.90,耗时0.64s。可见,基于改进的神经网络的中文文本事件检测方法具有更好的性能。
展开更多
关键词
改进神经网络
文本事件检测
自然场景文本检测
FPA
下载PDF
职称材料
基于事件要素的组合模型微博热点事件摘要提取
被引量:
5
10
作者
李纲
徐伟
王馨平
《图书情报工作》
CSSCI
北大核心
2018年第1期96-105,共10页
[目的/意义]为帮助读者从热点事件产生的海量微博报道中快速了解事件的来龙去脉,提高微博事件摘要的准确性和可读性,提出一种基于事件要素的多模型微博热点事件时间轴摘要提取方法。[方法/过程]针对微博文本特征,结合主题模型(LDA...
[目的/意义]为帮助读者从热点事件产生的海量微博报道中快速了解事件的来龙去脉,提高微博事件摘要的准确性和可读性,提出一种基于事件要素的多模型微博热点事件时间轴摘要提取方法。[方法/过程]针对微博文本特征,结合主题模型(LDA)与互信息最大熵模型(MaRxEnt-MI)的特点提取事件摘要关键词,以微博传播价值和主体相关性为标志筛选微博,以时间-摘要关键词——摘要微博的形式生成时间轴摘要。[结果/结论]利用人工标注的测试集,与传统是TextRank方法进行对比,F值提高8%-13%,内部测试表明摘要可读性提高明显。实验文本和测试集的数量及事件丰富度需要进一步扩展,应考虑更多的加权策略模型以提高摘要的准确性。实验结果及测试反馈表明,本文的方法能很好满足用户对热点事件摘要信息需求,提高微博摘要提取的准确率。
展开更多
关键词
文本挖掘
事件摘要
潜在狄利克·雷分布
互信息最大熵模型
原文传递
基于马尔可夫模型的新闻事件抽取方法
被引量:
1
11
作者
夏威
黄廷磊
+1 位作者
刘久云
华绿绿
《桂林电子科技大学学报》
2015年第4期325-328,共4页
针对目前事件抽取方法普遍存在正反例子不平衡的问题,提出一种基于实例驱动的事件抽取方法。该方法采用二元分类器过滤非事件句子,通过聚类事件句子完成事件抽取过程,利用马尔可夫模型对文档句子的位置信息进行描述。实验结果表明,该方...
针对目前事件抽取方法普遍存在正反例子不平衡的问题,提出一种基于实例驱动的事件抽取方法。该方法采用二元分类器过滤非事件句子,通过聚类事件句子完成事件抽取过程,利用马尔可夫模型对文档句子的位置信息进行描述。实验结果表明,该方法能有效解决正反例不平衡的问题,提高事件抽取的整体性能。
展开更多
关键词
事件抽取
新闻文本
分类
事件序列
聚类
下载PDF
职称材料
题名
从文本到事件:论扎西才让小说的事件之维
1
作者
胡亚蓉
机构
兰州交通大学文学院
出处
《兰州文理学院学报(社会科学版)》
2024年第5期18-22,共5页
基金
2024年兰州交通大学青年科学基金项目“‘他者’伦理视域下的新世纪敦煌书写研究”(LZJT 2024055)。
文摘
扎西才让的小说在整体上表现为处在不断生成、变化中的文学事件。循着从文本到事件的研究路径,从创作事件、文本事件、阅读事件三个层面入手,可以发现扎西才让小说作品中,作家的个体经验与以桑多藏地为代表的生活事件的有机交融,为扎西才让创造一个文学“桑多”世界打下坚实基础。与此同时,扎西才让小说文本借助言语行为的建构功能聚焦普通人鲜活、脆弱的生命体验,有助于阅读者将经由文字和语言表达出来的“世界”进行调整、重塑和再阐释,为阅读感受和小说意义的生成打开更多可能,使扎西才让小说始终向现实世界敞开。
关键词
扎西才让
文学事件
创作事件
文本事件
阅读事件
Keywords
Tashi
Cailang
literary
events
creation
events
text
events
reading
events
分类号
I207.4 [文学—中国文学]
下载PDF
职称材料
题名
数字视频中字幕检测及提取的研究和实现
被引量:
16
2
作者
蔡波
周洞汝
胡宏斌
机构
武汉大学计算机学院
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2003年第7期898-903,共6页
基金
国家电力公司科学基金 (SPKJ 0 16 0 71)资助
文摘
首先进行文字事件检测 ,然后进行边缘检测、阈值计算和边缘尺寸限制 ,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕 提出的叠加水平和垂直方向边缘的方法 ,加强了检测到的文字的边缘 ;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘 ;进一步 ,提出像素密度α的概念 ,并指出文字区域的像素密度α应在某一阈值范围之内 (αmin≤α≤αmax) 通过像素密度α滤去了非文字区域 ,应用投影法最终确定视频字幕所在区域 以上方法的结合保证了提出的算法的正确率和鲁棒性 选用不同类型的视频素材对文中算法进行实验 ,并与其他方法进行比较 。
关键词
数字视频
字幕检测
像素密度
鲁棒性
文字提取
Keywords
detection
of
text
event
digital
video
caption
extraction
edge
detection
text
ual
energy
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
利用OCR识别技术实现视频中文字的提取
被引量:
22
3
作者
陈义
李言俊
孙小炜
机构
西北工业大学航天学院
出处
《计算机工程与应用》
CSCD
北大核心
2010年第10期180-183,共4页
基金
国家自然科学基金No.60575013
西北工业大学研究生创新实验中心资助项目~~
文摘
为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方法,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘。应用投影法最终确定视频字幕所在区域。最后,利用OCR识别技术对提取出来的文字区域进行识别,完成视频中文字的提取。以上方法的结合保证了提出算法的正确率和鲁棒性。
关键词
光学文字识别
文字事件检测
数字视频
Keywords
Optical
Character
Recognition(OCR)
detection
of
text
event
digital
video
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合事件类型的中文事件抽取方法
4
作者
王瑾睿
李劼
机构
北京邮电大学计算机学院
出处
《计算机工程与应用》
北大核心
2025年第1期214-220,共7页
基金
国家自然科学基金(U22B2019)。
文摘
事件抽取技术是自动化地从文本信息中获得结构性数据的重要手段,也是自然语言处理领域的重点研究方向之一。事件抽取包含两个子任务,事件类型检测与事件论元抽取。近年来的事件抽取研究引入了预训练语言模型作为文本的语义表征,然后采用序列标注BIO完成抽取任务,但此类方法容易存在标签歧义问题。因此又有学者提出在事件文本特征中融入特征知识以避免歧义,可现有的融合方法忽略了事件抽取各个子任务间的依赖关系。为解决以上问题,针对事件抽取任务采用联合学习的算法框架,通过门融合机制将事件类型信息作为新知识融入事件的文本表示中,再进行事件触发词抽取与事件论元抽取。实验结果证明该算法模型在论元抽取任务上较之基线方法表现更优异。
关键词
文本事件抽取
预训练语言模型
门融合
Keywords
text
event
extraction
pre-trained
language
model
gate
fusion
分类号
TP391 [自动化与计算机技术—计算机应用技术]
题名
非压缩域数字视频中文字的检测与提取
被引量:
1
5
作者
高平利
任金昌
赵荣椿
机构
西北工业大学计算机学院
出处
《中国体视学与图像分析》
2004年第4期244-248,共5页
文摘
作为一种高级语义特征 ,视频中的文字信息对视频内容的理解、索引和检索具有重要意义。本文针对非压缩域中视频文字的检测与提取技术做了详尽的分析和讨论 ,涉及的内容包括 :文字事件的检测、帧图像中文字区域的检测与分割以及视频文字识别 (VideoOCR)等。对于不同的典型算法 ,分析了其理论基础和应用特点 ,并且通过对比指出其不足和应用的局限。最后 ,本文还展望了该技术未来发展的方向。
关键词
非压缩域
文字事件检测
文字分割与识别
视频索引与检索
Keywords
uncompressed
domain
text
event
detection
text
segmentation
and
recognition
video
indexing
and
retrieval
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于知识分层提取模型的服务台知识库建设
被引量:
3
6
作者
曹逸峰
陈晓伟
机构
中国农业银行股份有限公司数据中心
出处
《计算机系统应用》
2015年第2期261-265,共5页
文摘
针对传统运维知识库建设的不足,提出了一种面向服务台的生产运维知识自动分层提取模型.通过建立生产运维特征词库,对事件工单的短文本进行向量化解析,并利用改进的KNN算法实现事件短文本分类,最终通过领域主题规则完成知识的发现.将此方法应用到企业级服务台知识库建设中,完成了由事件工单到知识的自动转化,弥补了手工创建知识的缺陷,促进了整个运维流程的自动化.
关键词
运维知识库
服务台
事件短文本
特征向量
KNN算法
Keywords
operational
knowledge
base
service
desk
short
text
of
events
feature
vector
KNN
algorithm
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
TP391.1 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
以事件为特征的文本聚类方法
被引量:
1
7
作者
王崇国
机构
新疆大学信息科学与工程学院
出处
《计算机应用与软件》
CSCD
2010年第8期195-197,共3页
文摘
文本聚类是聚类的一个重要的研究分支,是聚类方法在自然语言处理领域的具体应用。研究表明事件在大量的文本中是客观存在的,诸多文本是由事件组成的,事件是文本表示的最小语义单位。探讨了以事件为特征的文本聚类方法,首先给出了基于事件的文本概念格表示模型,在此模型的基础上,给出了文本相似度的计算方法。最后,使用K-means聚类算法对所提方法进行了实验验证。
关键词
文本聚类
事件
文本相似度
概念格
Keywords
text
clustering
events
text
similarity
Concept
lattice
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
卡拉OK字幕的检测与定位
8
作者
陈文婷
李磊
杨盈昀
机构
中国传媒大学信息工程学院
出处
《中国传媒大学学报(自然科学版)》
2008年第2期71-76,共6页
文摘
本文针对视频序列文字的检测与提取技术做了详尽的分析和讨论,内容包括:文字事件的检测、帧图像中文字区域的检测与定位。首先进行文字事件检测,然后进行边缘检测,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘;进一步,提出像素密度δ的概念,并指出文字区域的像素密度δ应在某一阈值范围之内(δmin<δ<δmax)。通过像素密度δ滤去了非文字区域,应用投影法最终确定视频字幕所在区域。
关键词
文字事件检测
数字视频
字幕检测及提取
边缘检测
纹理能量
全方位像素膨胀
Keywords
detection
of
text
event
digital
video
caption
expand.
extraction
edge
detection
text
ual
energy
pixel
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文文本事件检测技术
9
作者
崔莹
机构
西南电子技术研究所
出处
《计算机与数字工程》
2022年第12期2700-2704,共5页
基金
国家自然科学基金项目(编号:U19A2078)
四川省科技计划重点研发项目(编号:2020YFG0009)资助。
文摘
随着深度学习的发展,神经网络在文本检测方面得到了更深入的研究和更广泛的应用。在此基础上,为了提升中文文本事件检各项性能,提出了一种基于改进神经网络的中文文本事件检测方法,研究利用FPA算法优化传统BP神经网络的权值和阈值。为了验证基于改进神经网络的中文文本事件检测方法的效果,将其与自然场景文本检测方法在召回率、准确率和耗时性等方面进行了比较。结果表明:自然场景文本检测方法的准确率为88%,召回率为73%;基于改进神经网络的文本检测方法准确率为95%,召回率为86%;中文文本事件检测测试中自然场景文本检测方法的F值为0.79,耗时4.56s;基于改进神经网络的文本检测方法的F值为0.90,耗时0.64s。可见,基于改进的神经网络的中文文本事件检测方法具有更好的性能。
关键词
改进神经网络
文本事件检测
自然场景文本检测
FPA
Keywords
improved
neural
network
text
event
detection
natural
scene
text
detection
FPA
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于事件要素的组合模型微博热点事件摘要提取
被引量:
5
10
作者
李纲
徐伟
王馨平
机构
武汉大学信息管理学院
出处
《图书情报工作》
CSSCI
北大核心
2018年第1期96-105,共10页
基金
国家社会科学基金重大项目“面向学科领域的网络信息资源深度聚合与服务研究”(项目编号:12&ZD221)研究成果之一
文摘
[目的/意义]为帮助读者从热点事件产生的海量微博报道中快速了解事件的来龙去脉,提高微博事件摘要的准确性和可读性,提出一种基于事件要素的多模型微博热点事件时间轴摘要提取方法。[方法/过程]针对微博文本特征,结合主题模型(LDA)与互信息最大熵模型(MaRxEnt-MI)的特点提取事件摘要关键词,以微博传播价值和主体相关性为标志筛选微博,以时间-摘要关键词——摘要微博的形式生成时间轴摘要。[结果/结论]利用人工标注的测试集,与传统是TextRank方法进行对比,F值提高8%-13%,内部测试表明摘要可读性提高明显。实验文本和测试集的数量及事件丰富度需要进一步扩展,应考虑更多的加权策略模型以提高摘要的准确性。实验结果及测试反馈表明,本文的方法能很好满足用户对热点事件摘要信息需求,提高微博摘要提取的准确率。
关键词
文本挖掘
事件摘要
潜在狄利克·雷分布
互信息最大熵模型
Keywords
text
mining
event
summarization
latent
dirichlet
allocation
mutual
information
maximum
entropy
model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于马尔可夫模型的新闻事件抽取方法
被引量:
1
11
作者
夏威
黄廷磊
刘久云
华绿绿
机构
桂林电子科技大学计算机科学与工程学院
出处
《桂林电子科技大学学报》
2015年第4期325-328,共4页
基金
国家863计划(2012AA011005)
文摘
针对目前事件抽取方法普遍存在正反例子不平衡的问题,提出一种基于实例驱动的事件抽取方法。该方法采用二元分类器过滤非事件句子,通过聚类事件句子完成事件抽取过程,利用马尔可夫模型对文档句子的位置信息进行描述。实验结果表明,该方法能有效解决正反例不平衡的问题,提高事件抽取的整体性能。
关键词
事件抽取
新闻文本
分类
事件序列
聚类
Keywords
event
extraction
news
text
elassify
event
sequence
cluster
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
从文本到事件:论扎西才让小说的事件之维
胡亚蓉
《兰州文理学院学报(社会科学版)》
2024
0
下载PDF
职称材料
2
数字视频中字幕检测及提取的研究和实现
蔡波
周洞汝
胡宏斌
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2003
16
下载PDF
职称材料
3
利用OCR识别技术实现视频中文字的提取
陈义
李言俊
孙小炜
《计算机工程与应用》
CSCD
北大核心
2010
22
下载PDF
职称材料
4
融合事件类型的中文事件抽取方法
王瑾睿
李劼
《计算机工程与应用》
北大核心
2025
0
5
非压缩域数字视频中文字的检测与提取
高平利
任金昌
赵荣椿
《中国体视学与图像分析》
2004
1
下载PDF
职称材料
6
基于知识分层提取模型的服务台知识库建设
曹逸峰
陈晓伟
《计算机系统应用》
2015
3
下载PDF
职称材料
7
以事件为特征的文本聚类方法
王崇国
《计算机应用与软件》
CSCD
2010
1
下载PDF
职称材料
8
卡拉OK字幕的检测与定位
陈文婷
李磊
杨盈昀
《中国传媒大学学报(自然科学版)》
2008
0
下载PDF
职称材料
9
中文文本事件检测技术
崔莹
《计算机与数字工程》
2022
0
下载PDF
职称材料
10
基于事件要素的组合模型微博热点事件摘要提取
李纲
徐伟
王馨平
《图书情报工作》
CSSCI
北大核心
2018
5
原文传递
11
基于马尔可夫模型的新闻事件抽取方法
夏威
黄廷磊
刘久云
华绿绿
《桂林电子科技大学学报》
2015
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部