期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于文本聚类的煤矿安全隐患类型挖掘研究 被引量:10
1
作者 谭章禄 王兆刚 +2 位作者 胡翰 姜萱 彭胜男 《中国安全科学学报》 CAS CSCD 北大核心 2019年第3期145-148,共4页
为提升煤矿安全管理者对隐患数据的理解和处理能力,提高隐患排查治理工作水平,将文本聚类方法运用于煤矿企业历史安全隐患记录数据的挖掘分析,并采用卡方统计量提取与类别关联度高的特征词描述聚类结果,研究历史隐患数据中记录的主要隐... 为提升煤矿安全管理者对隐患数据的理解和处理能力,提高隐患排查治理工作水平,将文本聚类方法运用于煤矿企业历史安全隐患记录数据的挖掘分析,并采用卡方统计量提取与类别关联度高的特征词描述聚类结果,研究历史隐患数据中记录的主要隐患的类型及特点。结果表明:文本聚类与卡方统计相结合,能够有效识别煤矿安全隐患数据中记录的主要隐患类型及特点;隐患排查治理工作应以数量多的隐患类型作为排查侧重点,根据隐患类型的特点制定相应的治理措施,以改善隐患排查治理工作的针对性和有效性。 展开更多
关键词 煤矿 安全隐患 文本聚类 关联度 隐患类型
下载PDF
基于Bigram的安全隐患文本分类研究 被引量:10
2
作者 陈孝慈 谭章禄 +1 位作者 单斐 高青 《中国安全科学学报》 CAS CSCD 北大核心 2017年第8期156-161,共6页
鉴于传统文本分类研究缺少针对性,在安全隐患文本分类实际应用中表现不佳,以及企业安全隐患文本文本长度短、特征单元选取困难,为高效地从大量安全隐患文本数据中提取、分析有效信息,更好地掌握安全隐患的发生和变化过程,提出利用Bigra... 鉴于传统文本分类研究缺少针对性,在安全隐患文本分类实际应用中表现不佳,以及企业安全隐患文本文本长度短、特征单元选取困难,为高效地从大量安全隐患文本数据中提取、分析有效信息,更好地掌握安全隐患的发生和变化过程,提出利用Bigram二字串作为特征单元,结合支持向量机(SVM)数据挖掘算法的安全隐患文本分类方法。以潞安集团司马煤业有限公司2009—2015年安全隐患记录为数据源,通过试验,验证该方法的分类效果。结果表明:新的安全隐患分类方法具有较高的准确率、召回率及F-值,与传统方法相比,显著提升了分类的准确度。 展开更多
关键词 安全隐患 Bigram二字串 特征单元 支持向量机(SVM) 文本分类
下载PDF
伤痕文学的创伤记忆与性别政治 被引量:6
3
作者 马春花 《南京师范大学文学院学报》 CSSCI 北大核心 2019年第4期76-87,共12页
本文从性别范畴研究1980年代的伤痕文学思潮,意在探究伤痕文学如何藉性别表意创伤,以创伤来建构"新时期"历史意识的记忆政治。伤痕文学在女性表象与男性主体、历史见证者与受害者、叙述者与被叙述者、归来者与丧失者等叙述结... 本文从性别范畴研究1980年代的伤痕文学思潮,意在探究伤痕文学如何藉性别表意创伤,以创伤来建构"新时期"历史意识的记忆政治。伤痕文学在女性表象与男性主体、历史见证者与受害者、叙述者与被叙述者、归来者与丧失者等叙述结构上存在一个性别与政治之间的转换机制。借助自然化的性别与性别关系型构,伤痕作家在以创伤叙事重构性别、代际、阶层等权力秩序的同时,也呼应并落实了一个走向重生时代的"新时期"意识形态。对伤痕文学的女性主义解读,不仅将指出伤痕文学的新父权本质,也可能发现一个隐藏于"光明"文本之内的"阴性"文本,它偏离了通过再造女性/底层等他者来确证主体的创伤叙述规范,重新打开了那个单维与封闭的记忆空间。 展开更多
关键词 伤痕文学 创伤记忆 性别政治 隐藏的文本
下载PDF
基于统计机器学习的互联网暗链检测方法 被引量:5
4
作者 孟池洁 王伟 耿光刚 《计算机应用研究》 CSCD 北大核心 2015年第9期2779-2783,共5页
互联网搜索引擎排名算法中,外部链接是一个重要因素,而利用链接作弊现象普遍存在于互联网中。暗链是链接作弊其中的一种手段,难以检测和清除,被称为"网络牛皮癣"。为了维护公平的搜索引擎排名机制,保证搜索结果质量,针对暗链... 互联网搜索引擎排名算法中,外部链接是一个重要因素,而利用链接作弊现象普遍存在于互联网中。暗链是链接作弊其中的一种手段,难以检测和清除,被称为"网络牛皮癣"。为了维护公平的搜索引擎排名机制,保证搜索结果质量,针对暗链这种作弊手段,提出了一种基于机器学习的互联网暗链检测方法,该方法结合网页源码锚文本的特征检测暗链。给出了相关性能分析,在真实的网络环境下的实验验证表明了所提出的方法可行有效。该研究为搜索引擎打击链接隐藏的作弊行为提供了理论和实践支撑。 展开更多
关键词 暗链 链接隐藏方式 锚文本 机器学习 文本分类
下载PDF
《格萨尔》伏藏文本中的“智态化”叙事模式——丹增扎巴文本解析 被引量:4
5
作者 诺布旺丹 《西藏研究》 CSSCI 北大核心 2009年第6期13-24,共12页
口头传统理论先驱洛德生在《故事的歌手》中把由艺人自己将自述的文本用书面形式写下来的文本确定为"自撰口述文本",《格萨尔》的伏藏文本即可以列入此类文本范畴。但是,丹增扎巴的《格萨尔》故事文本又与一般意义上的伏藏文... 口头传统理论先驱洛德生在《故事的歌手》中把由艺人自己将自述的文本用书面形式写下来的文本确定为"自撰口述文本",《格萨尔》的伏藏文本即可以列入此类文本范畴。但是,丹增扎巴的《格萨尔》故事文本又与一般意义上的伏藏文本不尽相同,他把佛教伏藏中的"智态化"(藏语称)伏藏传承方式纳入到其创作中,演绎成为史诗文本的创作理念和方法论,形成了一种独特的叙事模式,成为神授、掘藏、圆光等传承之外的又一重要的《格萨尔》叙事类型和传承方式。 展开更多
关键词 格萨尔 自传口述文本 伏藏传统 智态化文本
下载PDF
苗族古歌的潜文本解读——以黔东南苗族古歌为个案 被引量:3
6
作者 杜卓 《贵州民族学院学报(哲学社会科学版)》 2009年第3期83-85,共3页
目前很多学者比较关注从物质文化层面切入文学的研究,它可以反映特定历史时期的历史文化风貌、宗教信仰和哲学倾向,本文试图从文本及文本潜结构理论入手,对苗族古歌潜文本的历史文化、哲学层面进行解读。
关键词 苗族古歌 潜文本 解读
下载PDF
伊泽尔阅读理论:潜文本与再阐释的交流模式 被引量:2
7
作者 杨增和 《零陵学院学报》 2003年第6期62-64,共3页
读者与潜文本中一些不确定点形成强大张力关系而对作品符号进行解码和意义二度建构,空缺成为建造审美对象的重要引导契机,否定性成了文本和读者接受之间的调节者而激发读者的创造力量。
关键词 伊泽尔 潜文本 读者 交流
下载PDF
井下险情模糊位置辨析方法
8
作者 孙长春 黄晓凡 +4 位作者 苏令印 徐金陵 汤效平 王兹尧 林泽东 《软件导刊》 2023年第8期99-103,共5页
煤矿安全生产一直备受关注,如何确保矿工人身安全、确定隐藏险情模糊位置,一直是煤矿安全生产领域的研究重点。针对如何在井下复杂的环境中确定险情位置,提出一种井下险情模糊位置辨析方法。将收集到的矿工语音数据在移动端转化为文本数... 煤矿安全生产一直备受关注,如何确保矿工人身安全、确定隐藏险情模糊位置,一直是煤矿安全生产领域的研究重点。针对如何在井下复杂的环境中确定险情位置,提出一种井下险情模糊位置辨析方法。将收集到的矿工语音数据在移动端转化为文本数据,并对该数据进行模糊数据补全,通过优先级的策略补全数据集。最后,结合矿工的状态,通过质心算法确定险情位置。 展开更多
关键词 煤矿安全 隐藏险情 位置辨析 文本数据 数据处理
下载PDF
基于独立分量分析的隐蔽Web领域聚类 被引量:1
9
作者 王晓斌 温春 石昭祥 《计算机工程》 CAS CSCD 北大核心 2009年第7期175-176,179,共3页
针对隐蔽Web主题领域自动识别问题,提出一种基于独立分量分析(ICA)的聚类算法。对查询页面进行页面文本抽取和预处理,利用TF-IDF公式计算权重并选择前N个权重最大的特征词构造文档矩阵,在使用潜在语义索引(LSI)进行特征重构的基础上通过... 针对隐蔽Web主题领域自动识别问题,提出一种基于独立分量分析(ICA)的聚类算法。对查询页面进行页面文本抽取和预处理,利用TF-IDF公式计算权重并选择前N个权重最大的特征词构造文档矩阵,在使用潜在语义索引(LSI)进行特征重构的基础上通过ICA分解获得类别信息。利用LSI的词共现分析和文本降噪能力提高聚类准确率。实验表明聚类平均准确率达到90%以上。 展开更多
关键词 隐蔽Web 潜在语义 独立分量分析 文本聚类
下载PDF
基于数据增强的HSE检查纪要命名实体识别 被引量:1
10
作者 夏占杰 张贝克 高东 《中国安全科学学报》 CAS CSCD 北大核心 2022年第12期53-62,共10页
为解决用深度学习模型对安全检查纪要进行文本挖掘时,面临的数据集规模小、样本数据分布不均衡、命名实体识别(NER)效果差等问题,提出一种新的NER数据增强方法。首先,将数据集中的命名实体分离,并随机替换同类命名实体,避免数据增强技... 为解决用深度学习模型对安全检查纪要进行文本挖掘时,面临的数据集规模小、样本数据分布不均衡、命名实体识别(NER)效果差等问题,提出一种新的NER数据增强方法。首先,将数据集中的命名实体分离,并随机替换同类命名实体,避免数据增强技术对命名实体信息的破坏,使命名实体分布更加均匀;然后,通过优化其他部分的噪声数据和比例参数,进一步提高NER的效果;最后,通过自动标注分离后的数据,重新组合,以避免需要手动标注大量数据的弊端。结果表明:该方法可快速解决数据集数据量太小和数据集命名实体分布不均匀等问题;与更简单有效的数据增强(AEDA)方法相比,该方法在健康安全环境(HSE)检查纪要等数据集上取得更好的识别效果,使模型在1倍扩充数据上的综合评价指标从92.83%提升至97.23%;同时,能够得到建筑施工过程中安全隐患在空间上的分布规律和强关联规则。 展开更多
关键词 数据增强 健康安全环境(HSE) 检查纪要 命名实体识别(NER) 安全隐患 文本挖掘
下载PDF
论中俄当代小说历史叙事中的“食之味”
11
作者 张琼 《南京师范大学文学院学报》 CSSCI 北大核心 2020年第2期76-84,共9页
在多部中俄当代小说中,"吃"或者"食"常作为细致描写、深刻隐喻的代表,被用于展现时代或社会状况,揭示人性与之相应的复杂变化。首先,"食"是人类生存需求的底线,比起精神需求,它更能反映个体生存的困境及... 在多部中俄当代小说中,"吃"或者"食"常作为细致描写、深刻隐喻的代表,被用于展现时代或社会状况,揭示人性与之相应的复杂变化。首先,"食"是人类生存需求的底线,比起精神需求,它更能反映个体生存的困境及其历史成因。其次,一切个体的精神蒙难都展现在"吃"的不易之中。当代小说普遍以微观的个人辐射宏观的历史,期待打破意识形态规制下的统一叙事。再次,作者处于社会责任感和主流价值认同的撕扯中,"食之味"这样的隐藏文本往往比直白的批驳更具力量。这些旨在制造隐晦的文体修辞其实是作者让苦难叙事突破批判困境、更加逼近事实的努力。 展开更多
关键词 中俄当代小说 历史叙事 隐喻 隐藏文本
下载PDF
基于无线通信技术的橡胶林防盗系统
12
作者 胡文锋 肖飞 《农机化研究》 北大核心 2011年第9期216-219,共4页
以太阳能电池作为系统的能源,使用高聚度激光束作为加密和防盗介质,以单片机进行信号采集和信号传输的控制芯片,采用无线通信技术作为系统上位机(ARM处理器)的控制通信方式,从而达到园林的防盗目的。系统具有环保、易于组建、易恢复、... 以太阳能电池作为系统的能源,使用高聚度激光束作为加密和防盗介质,以单片机进行信号采集和信号传输的控制芯片,采用无线通信技术作为系统上位机(ARM处理器)的控制通信方式,从而达到园林的防盗目的。系统具有环保、易于组建、易恢复、低成本及高可靠性等特点。 展开更多
关键词 太阳能 激光加密 无线通讯
下载PDF
基于隐马尔可夫模型的文本信息抽取 被引量:51
13
作者 刘云中 林亚平 陈治平 《系统仿真学报》 CAS CSCD 2004年第3期507-510,共4页
文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐... 文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐马尔可夫模型进行文本信息抽取。仿真结果表明,新的算法在精确度和召回率方面有明显的提高。 展开更多
关键词 隐马尔可夫模型 信息抽取 文本分块 机器学习
下载PDF
基于网页上下文的Deep Web数据库分类 被引量:31
14
作者 马军 宋玲 +1 位作者 韩晓晖 闫泼 《软件学报》 EI CSCD 北大核心 2008年第2期267-274,共8页
讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属... 讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属性标记词的归一过程是把同义标记词用代表词进行替代的过程.给出了采用分层模糊集合对给定学习实例所发现的领域和语言知识进行表示和基于这些知识对标记词归一化算法.基于上述预处理,给出了计算Deep Web数据库的K-NN(k nearest neighbors)分类算法,其中对数据库之间语义距离计算综合了数据库表之间和含有数据库表的网页的内容文本之间的语义距离.分类实验给出算法对未预处理的网页和经过预处理后的网页在数据库分类精度、查全率和综合F1等测度上的分类结果比较. 展开更多
关键词 DEEP Web 隐式Web 数据库分类 内容文本抽取 语义分类
下载PDF
基于文本挖掘的煤矿安全隐患分析 被引量:22
15
作者 谭章禄 陈晓 +1 位作者 宋庆正 陈孝慈 《安全与环境学报》 CAS CSCD 北大核心 2017年第4期1262-1266,共5页
为充分有效利用煤矿安全隐患数据,揭示安全隐患数据中隐藏的重要信息和潜在规律,用于指导安全管理实践,在对安全隐患数据进行预处理的基础上,利用词云和词频统计方法展现安全隐患概况,运用文本挖掘技术和社会网络分析方法研究煤矿安全... 为充分有效利用煤矿安全隐患数据,揭示安全隐患数据中隐藏的重要信息和潜在规律,用于指导安全管理实践,在对安全隐患数据进行预处理的基础上,利用词云和词频统计方法展现安全隐患概况,运用文本挖掘技术和社会网络分析方法研究煤矿安全隐患信息的关联关系和分布规律。结果表明,将文本挖掘技术和社会网络分析方法应用于文本型安全隐患数据分析具有可行性,有助于煤矿企业提高对安全隐患数据的认知并制定合理的安全隐患治理措施。 展开更多
关键词 安全管理工程 煤矿隐患 文本挖掘 社会网络分析 关联关系
下载PDF
基于隐主题分析的中文微博话题发现 被引量:19
16
作者 史剑虹 陈兴蜀 王文贤 《计算机应用研究》 CSCD 北大核心 2014年第3期700-704,共5页
针对高维、稀疏的中文微博数据,提出一种多步骤的新闻话题发现方法。首先结合微博的传播特点,选取出不同时间窗口中具有较高新闻价值的微博文本;再利用隐主题模型挖掘微博内容中隐含的主题信息,并在此基础上进行文本聚类;最后使用频繁... 针对高维、稀疏的中文微博数据,提出一种多步骤的新闻话题发现方法。首先结合微博的传播特点,选取出不同时间窗口中具有较高新闻价值的微博文本;再利用隐主题模型挖掘微博内容中隐含的主题信息,并在此基础上进行文本聚类;最后使用频繁项集挖掘技术获取话题关键词集合。该算法能够较好地实现对中文微博数据的降维与话题发现。真实的微博数据集实验结果验证了该方法的有效性。 展开更多
关键词 中文微博 话题发现 隐主题模型 文本聚类 频繁项集挖掘
下载PDF
BioTrHMM:基于迁移学习的生物医学命名实体识别算法 被引量:18
17
作者 高冰涛 张阳 刘斌 《计算机应用研究》 CSCD 北大核心 2019年第1期45-48,共4页
为了降低生物医学文本中命名实体识别对目标领域标注数据的需求,将生物医学文本中的命名实体识别问题转换为基于迁移学习的隐马尔可夫模型问题。对要进行命名实体识别的目标领域数据集无须进行大量数据标注,通过迁移学习的方法实现对目... 为了降低生物医学文本中命名实体识别对目标领域标注数据的需求,将生物医学文本中的命名实体识别问题转换为基于迁移学习的隐马尔可夫模型问题。对要进行命名实体识别的目标领域数据集无须进行大量数据标注,通过迁移学习的方法实现对目标领域的识别分类;以相关领域数据为辅助数据集,利用数据引力的方法评估辅助数据集的样本在目标领域学习中的贡献程度,在辅助数据集和目标领域数据集上计算权值进行迁移学习。基于权值学习模型,构建基于迁移学习的隐马尔可夫模型算法BioTrHMM。在GENIA语料库的数据集上的实验表明,BioTrHMM算法比传统的隐马尔可夫模型算法具有更好的性能,仅需要少量的目标领域标注数据即可具有较好的命名实体识别性能。 展开更多
关键词 迁移学习 隐马尔可夫模型 命名实体识别 文本挖掘
下载PDF
基于文本挖掘的尾矿库隐患因素关联分析 被引量:12
18
作者 陈聪聪 赵怡晴 +2 位作者 姜琳婧 唐舟 田欣然 《矿业研究与开发》 CAS 北大核心 2021年第11期26-33,共8页
尾矿库作为人造高势能泥砂储存库,一旦发生严重的事故,将可能产生泥石流灾害,造成严重的生命安全损失、生态环境损失,甚至威胁社会的和谐稳定。对大量国内外尾矿库事故案例进行统计、分析,并采用文本挖掘对其进行分词处理,挖掘导致尾矿... 尾矿库作为人造高势能泥砂储存库,一旦发生严重的事故,将可能产生泥石流灾害,造成严重的生命安全损失、生态环境损失,甚至威胁社会的和谐稳定。对大量国内外尾矿库事故案例进行统计、分析,并采用文本挖掘对其进行分词处理,挖掘导致尾矿库事故的关键隐患因素,运用Python语言绘制了关键隐患词云图。基于此,采用Apriori(关联规则挖掘)算法分析了隐患因素之间的关联性,表征了隐患因素导致事故发生的耦合关系。最后通过共现分析获取共现矩阵,采用Ucinet等软件将共现矩阵转化为共现网络,实现了隐患因素间耦合关系的可视化。研究结果对防范尾矿库事故、提升尾矿库安全管理水平具有重要参考意义。 展开更多
关键词 尾矿库 事故隐患 文本挖掘 泥石流 共现分析
原文传递
结合TF-IDF的企业生产隐患关联预警及可视化研究 被引量:12
19
作者 胡瑾秋 张曦月 吴志强 《中国安全科学学报》 CAS CSCD 北大核心 2019年第7期170-176,共7页
为有效利用企业在日常管理中积累的大量生产事故隐患记录,实现隐患预警,解决人工分析数据效率低、主观性强等问题,构建结合词频率-逆文档频率(TF-IDF)的企业生产隐患关联预警可视化模型。首先,运用先验(Apriori)关联规则算法挖掘各隐患... 为有效利用企业在日常管理中积累的大量生产事故隐患记录,实现隐患预警,解决人工分析数据效率低、主观性强等问题,构建结合词频率-逆文档频率(TF-IDF)的企业生产隐患关联预警可视化模型。首先,运用先验(Apriori)关联规则算法挖掘各隐患间的潜在联系,获取信息中的隐藏价值;然后,引入TF-IDF算法优化关联规则,找出隐患间的关键规则;最后,运用可视化技术直观地展现挖掘结果。研究表明:可视化模型能快速、准确地实现隐患预警;对关联规则的优化,解决了Apriori算法支持度依赖性强的问题;挖掘结果能为企业安全管理者提供整改方向与依据。 展开更多
关键词 词频率-逆文档频率(TF-IDF) 先验(Apriori)关联分析 优化排序 隐患预警 文本可视化
下载PDF
煤矿安全隐患信息自动分类方法 被引量:9
20
作者 谢斌红 马非 +1 位作者 潘理虎 张英俊 《工矿自动化》 北大核心 2018年第10期10-14,共5页
人工分类方式难以满足海量煤矿安全隐患信息的分类要求,而基于概率统计的文本自动分类方法分类准确率较低。针对上述问题,提出了一种基于Word2vec和卷积神经网络的煤矿安全隐患信息自动分类方法。首先对隐患信息进行分词、去停用词等预... 人工分类方式难以满足海量煤矿安全隐患信息的分类要求,而基于概率统计的文本自动分类方法分类准确率较低。针对上述问题,提出了一种基于Word2vec和卷积神经网络的煤矿安全隐患信息自动分类方法。首先对隐患信息进行分词、去停用词等预处理,然后应用Word2vec来表征词之间的语义相似性关系,最后利用卷积神经网络提取隐患信息的局部上下文高层特征,并使用Softmax分类器实现隐患信息的自动分类。实验结果表明,该方法实现了端到端的自动分类,可有效提升分类的准确性和全面性。 展开更多
关键词 煤矿安全 隐患信息自动分类 文本分类 卷积神经网络 Word2vec
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部