期刊文献+
共找到548篇文章
< 1 2 28 >
每页显示 20 50 100
基于统计的常用词搭配(Collocation)的发现方法 被引量:15
1
作者 孙健 王伟 钟义信 《情报学报》 CSSCI 北大核心 2002年第1期12-16,共5页
常用词搭配 (collocation)是指一些常用的用来表达某些事情或事物的短语 ,一般是二元组或三元组等。常用词搭配的自动发现在自然语言处理中起着很重要的作用 ,它能够丰富词典的容量 ,提高系统的性能。本文提出 4种判断一个二元组是否是... 常用词搭配 (collocation)是指一些常用的用来表达某些事情或事物的短语 ,一般是二元组或三元组等。常用词搭配的自动发现在自然语言处理中起着很重要的作用 ,它能够丰富词典的容量 ,提高系统的性能。本文提出 4种判断一个二元组是否是常用词搭配的方法 ,并对各种方法的结果进行了比较。然后在已知二元组的基础上 ,提出了统计和发现三元或多元组的方法。这种利用二元组来构造三元组的方法 ,比统计所有三元组的计算量大大减少。 展开更多
关键词 常用词搭配 元组 自然语言处理 互信息 最大可能比 自动发现 三元组 元组
下载PDF
miR-221/222 activate the Wnt/β-catenin signaling to promote triple-negative breast cancer 被引量:16
2
作者 Sanhong Liu Zifeng Wang +4 位作者 Zukai Liu Shuo Shi Zhaoran Zhang Jiawei Zhang Haifan Lin 《Journal of Molecular Cell Biology》 SCIE CAS CSCD 2018年第4期302-315,共14页
Triple-negative breast cancer (TNBC), characterized by the lack of expression of the estrogen receptor, the progesterone receptor, and the human epidermal growth factor receptor 2, is an aggressive form of cancer th... Triple-negative breast cancer (TNBC), characterized by the lack of expression of the estrogen receptor, the progesterone receptor, and the human epidermal growth factor receptor 2, is an aggressive form of cancer that conveys unpredictable and poor prognosis due to limited treatment options and lack of effective targeted therapies. Wnt/β-catenin signaling is hyperactivated in TNBC, which promotes the progression of TNBC. However, the molecular mechanism of Wnt/β-catenin activation in TNBC remains unknown. Here, we report the drastic overexpression of miR-221/222 in all of four TNBC cell lines and TNBC primary tumor samples from patients. Furthermore, we demonstrate by both ex vivo and xenograft experiments that inhibiting miR-221/222 expression in a TNBC cell line (MDA-MB-231) suppresses its proliferation, viability, epithelial-to-mesenchymal transition, and migration; whereas expressing miR-221/222 in a non-TNBC line (MCF7) promotes all of the above cancer properties. miR-221/222 achieve so by directly repressing multiple negative regulators of the Wnt/β-catenin signaling pathway, including WIF1, SFRP2, DKK2, and AXIN2, to activate the pathway. Notably, the level of miR-221/222 expression is inversely correlated whereas that of WIF1, DKK2, SFRP2, and AXIN2 expression is positively correlated with the patient survival. Last, we show that anti-miR-221/222 significantly increases apoptotic cells with tamoxifen/Wnt3a treatment but not with cyclophosphamide/Wnt3a treatment. These results demonstrate that miR-221/222 activate the Wnt/β-catenin signaling to promote the aggressiveness and TNBC properties of breast cancers, and thus reveal a new prospect for TNBC treatment. 展开更多
关键词 miR-221/222 WNT/Β-CATENIN triple-negative breast cancer
原文传递
射频仿真幅相控制误差对目标位置精度的影响分析 被引量:12
3
作者 王泗宏   黄惠明  +1 位作者 李军  肖顺平 《飞行器测控学报》 2007年第2期59-63,共5页
在射频仿真系统中,精确的目标位置通过“三元组”幅相控制实现,幅相控制误差直接影响阵列上目标位置的模拟精度。详细推导了角闪烁方程,以此建立了幅控误差传播模型,提出了相控误差传播的等效分析方法,分析了幅相控误差对目标位置... 在射频仿真系统中,精确的目标位置通过“三元组”幅相控制实现,幅相控制误差直接影响阵列上目标位置的模拟精度。详细推导了角闪烁方程,以此建立了幅控误差传播模型,提出了相控误差传播的等效分析方法,分析了幅相控误差对目标位置精度影响的基本规律。基本分析结论经仿真验证正确,具有工程指导意义。 展开更多
关键词 射频仿真系统 三元组 角闪烁 目标位置精度
下载PDF
基础教育知识图谱赋能智慧教育 被引量:12
4
作者 许斌 苏伟杰 刘阳 《人工智能》 2019年第3期37-43,共7页
人工智能技术在基础教育领域的应用要求计算机必须具备基础教育领域的认知能力和理解能力。因此,如何在计算机中表示基础教育的知识成为了一个挑战。知识图谱是用于表示互联网知识的技术。它通过实体和关系来描述客观世界中的概念及其... 人工智能技术在基础教育领域的应用要求计算机必须具备基础教育领域的认知能力和理解能力。因此,如何在计算机中表示基础教育的知识成为了一个挑战。知识图谱是用于表示互联网知识的技术。它通过实体和关系来描述客观世界中的概念及其相互关系。清华大学的研究人员将知识图谱技术用于表示基础教育领域的知识,构造出一个包含1000多个类、160万个实例、4000多种属性、2200万条三元组的基础教育知识图谱edukg.org,并将其应用到智慧教育中。 展开更多
关键词 智慧教育 知识搜索 三元组 知识图谱 电子教材
下载PDF
自然语言处理的重要资源:“知识图谱” 被引量:10
5
作者 冯志伟 《外语学刊》 CSSCI 北大核心 2021年第5期1-9,共9页
早在1972年的文献中就出现了"知识图谱"这个术语,2012年5月,谷歌公司明确地提出了知识图谱的概念并构建了一个大规模的知识图谱,开知识图谱研究之先河。知识图谱用结点表示语义符号,用边表示符号与符号之间的语义关系,构成了... 早在1972年的文献中就出现了"知识图谱"这个术语,2012年5月,谷歌公司明确地提出了知识图谱的概念并构建了一个大规模的知识图谱,开知识图谱研究之先河。知识图谱用结点表示语义符号,用边表示符号与符号之间的语义关系,构成了一种通用的语义知识形式化的描述,成为了自然语言处理的重要资源。本文介绍知识图谱的发展历史和基本原理,对于知识图谱的三元组(头实体,关系,尾实体)进行了形式化的描述,分析了知识图谱在自然语言处理研究中的重要作用,并分别介绍了Wikipedia、DBpedia、TAGO、Freebase、Wikidata、NELL、Knowledge Vault等大规模的知识图谱以及我国以中文为主语言的知识图谱和COKG-19知识图谱。由于知识图谱的三元组是建立在谓词逻辑的基础之上的,其表示方式有一定的局限性,本文建议把深度学习中的词向量与知识图谱结合起来,把基于直觉的"系统1"知识和基于理性分析的"系统2"知识结合起来,改进当前知识图谱的不足,把知识图谱推进到认知图谱。 展开更多
关键词 知识图谱 词向量 三元组 头实体 关系 尾实体
原文传递
基于SAO的技术主题创新演化路径识别及其可视化研究 被引量:6
6
作者 刘春江 刘自强 方曙 《情报学报》 CSCD 北大核心 2023年第2期164-175,共12页
利用专利文献数据识别技术领域的技术主题演化发展路径并分析其发展趋势,对于科技界、企业界进行专利技术创新具有重要的意义。首先,使用Open IE 5.1进行SAO(subject-action-object)三元组抽取,基于LDA(latent Dirichlet allocation)模... 利用专利文献数据识别技术领域的技术主题演化发展路径并分析其发展趋势,对于科技界、企业界进行专利技术创新具有重要的意义。首先,使用Open IE 5.1进行SAO(subject-action-object)三元组抽取,基于LDA(latent Dirichlet allocation)模型进行主题识别,根据TRIZ技术创新思想,基于action语义词典将技术主题划分到四个维度;然后,通过计算SAO三元组之间的相似度来测度技术主题之间的语义关联构建技术主题创新演化路径,并利用可视化技术构建技术主题创新演化路径可视化图谱,利用该图谱辅助分析技术主题演化脉络及其发展趋势。最后,通过石墨烯超级电容器(集流体)领域的实证,对该领域的技术问题(problem to problem,P-P)主题、技术功能(solution to solution,S-S)主题、解决方案(problem to solution,P-S)主题和技术效果(solution to problem,S-P)主题的创新演化路径进行解读分析,验证了本研究提出方法的可行性和有效性。 展开更多
关键词 三元组 技术主题 演化路径 可视化
下载PDF
高效的基于段模式的恶意URL检测方法 被引量:9
7
作者 林海伦 李焱 +2 位作者 王伟平 岳银亮 林政 《通信学报》 EI CSCD 北大核心 2015年第S1期141-148,共8页
提出一种高效的基于段模式的检测恶意URL的方法,该方法首先解析已标注的恶意URL中的域名、路径名和文件名3个语义段,然后通过建立以三元组为词项的倒排索引快速计算恶意URL每个语义段的模式,最后基于倒排索引查找到的段模式来判定给定的... 提出一种高效的基于段模式的检测恶意URL的方法,该方法首先解析已标注的恶意URL中的域名、路径名和文件名3个语义段,然后通过建立以三元组为词项的倒排索引快速计算恶意URL每个语义段的模式,最后基于倒排索引查找到的段模式来判定给定的URL是否是恶意URL。不仅如此,该方法还支持基于Jaccard的随机域名识别技术来判定包含随机域名的恶意URL。实验结果表明,与当前先进的基准方法相比,该方法具有较好的性能和可扩展性。 展开更多
关键词 恶意URL 段模式 三元组 倒排索引 随机域名
下载PDF
审计知识图谱的构建与研究——基于Neo4j的图谱技术 被引量:8
8
作者 王瑞萍 刘峰 +1 位作者 杨媛琦 邢春玉 《中国注册会计师》 北大核心 2020年第9期109-113,共5页
随着审计业务复杂性和数据体量的范围呈指数级别的增长,传统审计逐渐难以满足信息化查询和审计可视化的现实需求。知识图谱融合大数据和人工智能的前沿技术,为组织、管理和理解互联网海量信息等提供了强大的功能。本文基于Neo4j图数据... 随着审计业务复杂性和数据体量的范围呈指数级别的增长,传统审计逐渐难以满足信息化查询和审计可视化的现实需求。知识图谱融合大数据和人工智能的前沿技术,为组织、管理和理解互联网海量信息等提供了强大的功能。本文基于Neo4j图数据库进行审计知识数据的清洗、知识三元组的构建、存储,并完成审计领域的知识图谱,有助于企业和相关部门运用审计知识图谱,将传统的业务推动数据模式转化为数据推动业务模式,提高审计效率,挖掘不易发现的数据式审计证据,为审计需求相关方的决策提供参考价值。 展开更多
关键词 知识图谱 三元组 注册会计师 图关系数据库 Neo4j
下载PDF
稀疏矩阵相乘的一个改进算法 被引量:6
9
作者 蒋川群 杜奕 《计算机工程与应用》 CSCD 北大核心 2009年第19期55-57,共3页
稀疏矩阵的乘法运算可用于解决许多实际的应用问题。提出一种新颖的稀疏矩阵相乘算法,算法实现中将计算单元由单个元素扩展至行向量,避免了矩阵的转置,减少了扫描次数。利用三元组和少量的额外辅助空间实现稀疏矩阵的相乘。实验结果表... 稀疏矩阵的乘法运算可用于解决许多实际的应用问题。提出一种新颖的稀疏矩阵相乘算法,算法实现中将计算单元由单个元素扩展至行向量,避免了矩阵的转置,减少了扫描次数。利用三元组和少量的额外辅助空间实现稀疏矩阵的相乘。实验结果表明了该算法的有效性。 展开更多
关键词 稀疏矩阵 三元组 矩阵乘法 行向量
下载PDF
一种对语义网上本体进行检索和排序新方法 被引量:4
10
作者 虞为 陈俊鹏 曹加恒 《小型微型计算机系统》 CSCD 北大核心 2007年第6期1044-1048,共5页
提出了一种对语义网上的本体进行检索和排序的新方法ARRO(an Approach for Retrieval and Ranking for the On-tology),其核心思想是通过对本体进行解析产生逻辑三元组.再在三元组的基础上进行逻辑推理,形成概念的逻辑视图,然后通过排... 提出了一种对语义网上的本体进行检索和排序的新方法ARRO(an Approach for Retrieval and Ranking for the On-tology),其核心思想是通过对本体进行解析产生逻辑三元组.再在三元组的基础上进行逻辑推理,形成概念的逻辑视图,然后通过排序公式对相关本体进行检索和排序.这种通过逻辑视图和三元组对本体进行检索和排序的方法可以有效的进行逻辑推理,并提高检索效率,从而解决在传统的基于关键字的信息检索中只能从句法上对关键字进行分析,无法将推理和检索相互结合,互相促进的问题.本文对ARRO进行了测试,结果验证了其实用性和有效性. 展开更多
关键词 逻辑视图 三元组 逻辑推理
下载PDF
航空网络结构鲁棒性分析 被引量:1
11
作者 赖强 马鑫 +1 位作者 张宏昊 池明 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期106-111,共6页
针对航空网络中大量的三元组结构,提出三元组相对量测度用以衡量航空网络结构鲁棒性.基于相对熵理论,提出更一般的网络结构变化测度指标,即度分布相对熵和集聚系数分布相对熵,来评价航空网络特征分布的变化.运用复杂网络理论构建国内航... 针对航空网络中大量的三元组结构,提出三元组相对量测度用以衡量航空网络结构鲁棒性.基于相对熵理论,提出更一般的网络结构变化测度指标,即度分布相对熵和集聚系数分布相对熵,来评价航空网络特征分布的变化.运用复杂网络理论构建国内航空网络模型,采用多种攻击策略对国内航空网络的结构鲁棒性进行仿真实验.结果表明:国内航空网络在各测度与攻击方式中表现出不同的结构鲁棒性,三元组相对量不仅反映了网络结构,而且呈现了网络功能变化;最小三元组边在维持网络运输功能上也表现出重要意义. 展开更多
关键词 航空网络 相对熵 三元组 测度指标 结构鲁棒性
原文传递
“三元组近场”新型幅度控制精确算法 被引量:5
12
作者 王泗宏 黄惠明 +2 位作者 喻戈阳 李军 肖顺平 《现代雷达》 CSCD 北大核心 2005年第12期64-67,共4页
在电磁辐射和散射测量时,为使目标处于平面波照射区,被测目标和天线的距离应满足远场条件。但是在一些电子战设备进行暗室内性能测试时,根据这些设备的工作波长和天线口径,则需要建造很大的微波暗室,事实是在很多情况下是不现实的。为此... 在电磁辐射和散射测量时,为使目标处于平面波照射区,被测目标和天线的距离应满足远场条件。但是在一些电子战设备进行暗室内性能测试时,根据这些设备的工作波长和天线口径,则需要建造很大的微波暗室,事实是在很多情况下是不现实的。为此,详细推导了一种“三元组近场”条件下的幅度控制精确算法,该算法能将辐射式仿真远场测试距离降低约1倍,实现近场效应修正,可以广泛应用于工程实践。 展开更多
关键词 射频仿真 近场修正 三元组
下载PDF
幅相控制精度对射频仿真目标位置误差的影响 被引量:7
13
作者 武鹏飞 何秋茹 《现代防御技术》 北大核心 2016年第6期167-173,共7页
在射频仿真系统中,目标的精确位置是通过对三元组辐射信号的幅度和相位控制来实现的,幅度和相位控制精度直接影响目标位置的模拟精度。基于波因廷矢量法建立了三元组合成位置模型,以两元组为例,分析了二元组合成位置特性及其对幅度和相... 在射频仿真系统中,目标的精确位置是通过对三元组辐射信号的幅度和相位控制来实现的,幅度和相位控制精度直接影响目标位置的模拟精度。基于波因廷矢量法建立了三元组合成位置模型,以两元组为例,分析了二元组合成位置特性及其对幅度和相位的灵敏度特性,建立了合成位置误差与幅相控制精度关系的数学模型,并给出了合成位置误差的分布规律,结论具有工程指导意义。 展开更多
关键词 射频仿真 三元组 波因廷矢量 目标位置误差 幅度灵敏度 相位灵敏度
下载PDF
限定域关系抽取技术研究综述 被引量:1
14
作者 侯景 邓晓梅 汉鹏武 《计算机科学》 CSCD 北大核心 2024年第1期252-265,共14页
限定域关系抽取技术是在预定义实体类型和关系类型的前提下,从文本中捕获关键信息的技术,多采用由头尾实体和关系构成的三元组作为信息表示形式。作为信息抽取领域的重要研究方向之一,其在知识问答、信息检索等任务中被广泛应用。文中... 限定域关系抽取技术是在预定义实体类型和关系类型的前提下,从文本中捕获关键信息的技术,多采用由头尾实体和关系构成的三元组作为信息表示形式。作为信息抽取领域的重要研究方向之一,其在知识问答、信息检索等任务中被广泛应用。文中在介绍相关概念和任务范式的基础上,分析了深度学习背景下限定域关系抽取任务的研究进展,根据句中实体是否可见,分为关系分类任务和三元组抽取任务,依据任务表现特征,前者可细分为有监督条件下的关系分类任务、小样本关系分类任务和远程监督条件下的关系分类任务。文中探讨和分析了以上任务中常用的技术方法及其优缺点,最后归纳总结了关系抽取技术在低资源、多模态等更为接近真实情景下的发展潜力和现存的挑战。 展开更多
关键词 限定域关系抽取 深度学习 关系分类 三元组 远程监督
下载PDF
机械装配工艺文本的实体关系抽取方法研究
15
作者 尹昱东 王保建 +2 位作者 李珂嘉 王紫平 刘洁 《计算机测量与控制》 2024年第6期198-205,219,共9页
机械装配过程常常需要人工阅读并理解大量装配工艺文本,从而耗费大量时间,并且由于装配工艺文本书写人员和装配人员能力的差异,可能会导致装配人员错误理解装配文本,产生零部件错装、漏装等问题;机械装配矩阵以矩阵形式存储零部件的装... 机械装配过程常常需要人工阅读并理解大量装配工艺文本,从而耗费大量时间,并且由于装配工艺文本书写人员和装配人员能力的差异,可能会导致装配人员错误理解装配文本,产生零部件错装、漏装等问题;机械装配矩阵以矩阵形式存储零部件的装配实体关系,可以直接、有效表达装配关系,不仅易于工人理解装配关系,也便于计算机识别,可以显著提高装配效率。自然语言处理作为研究计算机理解人类语言的工具,在根据装配文本生成装配矩阵的任务中可以起到关键的作用;文章采用自然语言处理的方法,对装配文本进行断句、分词、词性标注等文本预处理操作,采用机械装配名词语料库辅助以提高对装配零件的分词、词性标注时的准确率;用语法依存关系分析和语法模板匹配两种方法生成每个句子的主语、谓语、宾语三元组,其中采用机械装配名词语料库进行匹配,以判断其中的装配零部件名;之后提取出主语及宾语都为装配零件的三元组作为一个装配关系,对其进行去除冗余词、实体对齐等后处理操作;最后根据零部件数量组成一个空矩阵,将装配关系填入接触矩阵,并根据零部件类型判断生成装配关系的接触-连接矩阵。 展开更多
关键词 装配工艺文本 实体关系 自然语言处理 词性标注 三元组 装配关系矩阵
下载PDF
海底隧道施工安全技术风险监控方法研究
16
作者 王恒 《中文科技期刊数据库(全文版)工程技术》 2024年第6期0154-0156,共3页
在进行施工安全技术风险监控时,由于对风险因素的综合分析效果较差,导致难以实现对不同类型安全技术风险有效监控,为此,提出海底隧道施工安全技术风险监控方法研究。针对海底隧道施工项目工作内容,分别以起重作业(舾装件安装、模板安装... 在进行施工安全技术风险监控时,由于对风险因素的综合分析效果较差,导致难以实现对不同类型安全技术风险有效监控,为此,提出海底隧道施工安全技术风险监控方法研究。针对海底隧道施工项目工作内容,分别以起重作业(舾装件安装、模板安装、材料起吊),动火作业以及模板工程为中心,对施工安全技术风险因素进行细化分析。在技术风险监控阶段,引入了可拓学,将待监测的施工技术作为可拓学中的物元,并以有序的三元组对其加以表示,结合施工安全技术风险因素分析结果,采用综合分析的方式确定对应的技术是否处于风险状态。在测试结果中,设计监测方法对于不同类型安全技术风险均实现了准确监测,并未出现风险因素未识别的情况。 展开更多
关键词 海底隧道施工 安全技术风险 技术风险因素 可拓学 三元组
下载PDF
一种新颖的汉字字形相似度计算方法 被引量:5
17
作者 王东 熊世桓 《计算机应用研究》 CSCD 北大核心 2013年第8期2395-2397,共3页
为了利用字形描述技术识别相似汉字,提出了三元组递归表示的汉字字形相似度计算方法。该算法把汉字表示为汉字结构、字首部件和字尾部件三元组,以部件为运算对象,字型结构为运算符,将汉字描述为前缀表达式。通过建立汉字字形相似度计算... 为了利用字形描述技术识别相似汉字,提出了三元组递归表示的汉字字形相似度计算方法。该算法把汉字表示为汉字结构、字首部件和字尾部件三元组,以部件为运算对象,字型结构为运算符,将汉字描述为前缀表达式。通过建立汉字字形相似度计算递归模型,使计算过程被逐层分解为原子部件间的相似性比较,从而更好地降低了计算的复杂性。然后将其用于计算汉字的最佳相似字。实验结果表明,该方法与人的认知结果吻合度很好,算法是有效可行的。 展开更多
关键词 汉字字形 形近字 相似度计算 前缀表达式 三元组
下载PDF
基于T5 PEGASUS和DeepKE的文本摘要生成研究
18
作者 张琪 王玲 申杰 《电脑与电信》 2024年第6期62-67,共6页
为减少T5PEGASUS模型生成的摘要中的虚构信息、重复等问题,提出了一种基于T5PEGASUS和DeepKE的文本摘要生成模型——T5PEGASUS-DK。该模型将T5PEGASUS模型和DeepKE框架相融合,先使用Pkuseg分词方法改进分词效果,再使用DeepKE框架抽取文... 为减少T5PEGASUS模型生成的摘要中的虚构信息、重复等问题,提出了一种基于T5PEGASUS和DeepKE的文本摘要生成模型——T5PEGASUS-DK。该模型将T5PEGASUS模型和DeepKE框架相融合,先使用Pkuseg分词方法改进分词效果,再使用DeepKE框架抽取文本中的三元组,最后将三元组的词向量集合与文本的表示向量进行拼接。通过建立文本与三元组之间的映射关系,使得模型可以提取出事实性知识,从而提取出与原文内容更相符的信息作为摘要。T5PEGASUS-DK模型的ROUGE值均达到最高,所生成的摘要更真实、连贯,与原文内容更相符。 展开更多
关键词 文本摘要生成 T5 PEGASUS DeepKE 三元组 ROUGE
下载PDF
基于知识图谱的矿山系统智能问答运维服务
19
作者 李志伟 徐华龙 杨大山 《煤矿机电》 2024年第3期38-42,共5页
矿山系统的运维和售后服务对于设备的高效运行和及时维护至关重要。然而,传统的运维服务模式存在信息不对称、专家资源有限以及响应时间长等问题。为了解决这些挑战,提出了一种基于知识图谱的智能问答运维服务。该服务平台利用知识图谱... 矿山系统的运维和售后服务对于设备的高效运行和及时维护至关重要。然而,传统的运维服务模式存在信息不对称、专家资源有限以及响应时间长等问题。为了解决这些挑战,提出了一种基于知识图谱的智能问答运维服务。该服务平台利用知识图谱的优势,结合专家知识和用户需求,提供运维服务的智能问答,以提高矿山系统的维护效率和用户满意度。介绍了矿山系统售后服务的背景和问题,然后详细描述了基于知识图谱的智能问答运维服务的设计和实现,包括知识图谱构建、用户需求建模、问答模型训练。通过研究,形成了一套低成本、易维护、能智能支持运维工作的运维服务。 展开更多
关键词 知识图谱 矿山系统 智能问答 本体 三元组 资源描述框架
下载PDF
基于文本语料的涉恐事件实体属性抽取 被引量:6
20
作者 曹文斌 武卓峰 +1 位作者 杨涛 凡友荣 《工程科学学报》 EI CSCD 北大核心 2020年第4期500-508,共9页
基于语义角色分析,提出了一种三元组涉恐事件实体属性抽取方法,为网络空间涉恐活动的监测及预警提供技术支持.首先,基于西北政法大学"反恐怖主义信息网"文本语料数据进行数据采集和清洗等预处理工作,采用朴素贝叶斯文本分类... 基于语义角色分析,提出了一种三元组涉恐事件实体属性抽取方法,为网络空间涉恐活动的监测及预警提供技术支持.首先,基于西北政法大学"反恐怖主义信息网"文本语料数据进行数据采集和清洗等预处理工作,采用朴素贝叶斯文本分类算法识别涉恐事件文本,并采用关键词提取算法TF-IDF(Term frequency-inverse document frequency,词频-逆文档频率)构建涉恐专有词库,结合自然语言处理技术构建带词性的涉恐专有词库.然后通过语义角色分析、句法依存分析,提取了主语谓语宾语关系、定语后置动宾关系、人名//地名//机构和介宾关系主谓动补4类涉恐三元组结构.最后,利用正则表达式及带词性的涉恐专有名词分析,在4类三元组短文本中提取出恐怖事件发生时间、发生地点、伤亡情况、攻击方式、武器类型和恐怖组织6类实体属性.对采集的4221篇文章数据进行实验分析,6类实体属性抽取的测评结果 F1值均超过80%,对网络空间的涉恐事件监测及预警,维护社会公共安全具有重要现实意义. 展开更多
关键词 实体抽取 语义角色分析 三元组 朴素贝叶斯 文本分类
下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部