期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
文本自动分类系统文本预处理方法的研究 被引量:15
1
作者 周钦强 孙炳达 王义 《计算机应用研究》 CSCD 北大核心 2005年第2期85-86,共2页
在没有建立起完善的中文停用词表的情况下,运用程序流程控制剔除中文分词器切分出来的单个独立字、英文字符、数字和一系列数学符号以及含有这些符号的中文词,从而使得两个字以上的纯中文词成为代表文本信息的特征项。这不仅明显降低了... 在没有建立起完善的中文停用词表的情况下,运用程序流程控制剔除中文分词器切分出来的单个独立字、英文字符、数字和一系列数学符号以及含有这些符号的中文词,从而使得两个字以上的纯中文词成为代表文本信息的特征项。这不仅明显降低了初始文本向量的维度,而且大大提高了文本向量中的特征信息含量。 展开更多
关键词 文本分类 文本预处理 停用词 中文分词
下载PDF
基于改进TF-IDF算法的文本分类方法研究 被引量:22
2
作者 贺科达 朱铮涛 程昱 《广东工业大学学报》 CAS 2016年第5期49-53,共5页
类别关键词是文本分类首先要解决的关键问题,在研究利用类别关键词及TF-IDF算法对文本进行分类的基础上,提出了一种改进的TF-IDF算法.首先建立类别关键词库,并对其进行扩充及去重,克服了向量空间模型不能很好调节权重的缺点.通过加入文... 类别关键词是文本分类首先要解决的关键问题,在研究利用类别关键词及TF-IDF算法对文本进行分类的基础上,提出了一种改进的TF-IDF算法.首先建立类别关键词库,并对其进行扩充及去重,克服了向量空间模型不能很好调节权重的缺点.通过加入文档长度权值修正文档中关键词的权重,有效地解决了原有特征词条类别区分能力不足的问题.采用贝叶斯分类方法,结合实验验证了该算法的有效性,提高了文本分类的准确度. 展开更多
关键词 提取 特征选择 文本分类 预处理
下载PDF
基于大数据的电网设备监控信息自动分类方法 被引量:18
3
作者 陆晓 刘翌 +2 位作者 齐敬先 霍雪松 蒋宇 《电子设计工程》 2019年第11期119-122,127,共5页
采用传统方法对电网设备监控信息进行分类时,缺少对监控信息的预处理步骤,导致分类效果较差,为了解决该问题,提出了基于大数据的电网设备监控信息自动分类方法。分析电网设备监控信息数据采集结构,对信息数据进行预处理,并在大数据环境... 采用传统方法对电网设备监控信息进行分类时,缺少对监控信息的预处理步骤,导致分类效果较差,为了解决该问题,提出了基于大数据的电网设备监控信息自动分类方法。分析电网设备监控信息数据采集结构,对信息数据进行预处理,并在大数据环境下,采取信息梳理的方式合理合并相关同类事项。设计信息梳理流程,将信息进行归档,以此构建信息熵数学模型,计算电网设备出现故障的几率,获取有效预警信息文档。依据信息自动分类流程,实现对电网设备监控信息的自动分类。通过实验对比结果可知,采用基于大数据方法分类效果最高可达到98%,说明该方法适应了电力大数据快速增长趋势,能够为设备监控信息分类提供有力支持。 展开更多
关键词 大数据 电网设备 监控信息 自动分类 数据采集 预处理
下载PDF
消毒供应中心器械清洗流程与质量控制 被引量:9
4
作者 陈红春 侯丽阳 +3 位作者 潘雪玉 陈奕兰 洪宝平 刘灿荣 《中国卫生标准管理》 2016年第15期187-190,共4页
目的:彻底的清洗是灭菌合格的前提。对清洗过程中每个环节进行质量控制,达到理想的清洗效果。方法消毒供应中心去污区主要的工作流程包括回收、分类、预清洗、清洗、消毒、润滑和干燥。及时的回收和分类可以提高工作效率;有效的预处... 目的:彻底的清洗是灭菌合格的前提。对清洗过程中每个环节进行质量控制,达到理想的清洗效果。方法消毒供应中心去污区主要的工作流程包括回收、分类、预清洗、清洗、消毒、润滑和干燥。及时的回收和分类可以提高工作效率;有效的预处理可以降低清洗难度,提高清洗效果;有针对性的清洗方式和清洗剂能有效去除器械表面的血液及其他污物,降低表面的微生物残留;锈渍的细菌滋生的温床,除锈能有效的去除不锈钢器械表面的锈渍,防止锈渍的传染;润滑防锈主要针对不锈钢材质器械,水溶性润滑剂能在器械表面形成一层油膜,防止器械氧化,增加关节器械的灵活度;对于不同材质的器械选择最有效的消毒方法,耐湿热的器械优先选择湿热消毒,不耐湿热的器械使用75%的酒精消毒,能有效降低器械表面的生物负载,降低交叉感染率。结果对2014年1-6月,21000个器械包内的1600件器械进行抽查,器械光亮、洁净、无血渍、锈渍、污渍视为合格,否则视为不合格。共统计检测合格数1573,不合格数为27。结论器械的清洗效果直接影响了最终灭菌的结果,是消毒供应中心日常工作中最重要的环节之一;而通过科学的管理方法、规范化的流程操作和及时的保养处理,可有效保证器械清洗效果、延长器械使用寿命,从而提高工作效率,降低医院感染风险。 展开更多
关键词 彻底的清洗 回收和分类 预处理 除锈 润滑 消毒 干燥 灭菌
下载PDF
一种新的中文文本分类算法 被引量:6
5
作者 李荣艳 金鑫 +2 位作者 王春辉 郑宁 别荣芳 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第5期501-505,共5页
对于中文文本分类问题,使用了一种新的RBF神经网络算法.这一方法通过高斯径向基函数,使用k均值推导出隐藏项的中心点及宽度,并将由隐藏层得到的输出结果合并起来,从而得到分类结果.试验证明,这种算法的准确率、召回率、F测量的值都很高... 对于中文文本分类问题,使用了一种新的RBF神经网络算法.这一方法通过高斯径向基函数,使用k均值推导出隐藏项的中心点及宽度,并将由隐藏层得到的输出结果合并起来,从而得到分类结果.试验证明,这种算法的准确率、召回率、F测量的值都很高,得到的分类效果很好. 展开更多
关键词 文本分类 预处理 特征提取 径向基函数
下载PDF
厨余垃圾处理厂污水处理系统关键问题探讨 被引量:7
6
作者 丁西明 康建邨 +3 位作者 高波 孙月驰 汤萌萌 刘荣飞 《环境卫生工程》 2021年第5期69-73,共5页
厨余垃圾处理厂产生的污水具有污染物成分复杂,水质水量波动大,有机物和氨氮浓度高,含杂含油量大,处理难度大等特点。结合厨余垃圾处理厂污水水质特点,对污水处理系统中排放标准、预处理工艺和深度处理工艺的选择、生物池冷却系统以及... 厨余垃圾处理厂产生的污水具有污染物成分复杂,水质水量波动大,有机物和氨氮浓度高,含杂含油量大,处理难度大等特点。结合厨余垃圾处理厂污水水质特点,对污水处理系统中排放标准、预处理工艺和深度处理工艺的选择、生物池冷却系统以及碳源投加等关键问题进行了分析探讨。 展开更多
关键词 垃圾分类 厨余垃圾 排放标准 预处理工艺 非膜法
下载PDF
基于kNN的多标签分类预处理方法 被引量:5
7
作者 徐晓丹 姚明海 +1 位作者 刘华文 郑忠龙 《计算机科学》 CSCD 北大核心 2015年第5期106-108,131,共4页
多标签学习已成为当前机器学习的研究热点。为了提高分类性能,对训练集中的噪声数据进行预处理,提出一种基于k近邻(kNN)的多标签分类去噪方法:对现有的多标签数据集进行分析后获得近似正态分布的特征,通过将噪声标记改为其k近邻标记的方... 多标签学习已成为当前机器学习的研究热点。为了提高分类性能,对训练集中的噪声数据进行预处理,提出一种基于k近邻(kNN)的多标签分类去噪方法:对现有的多标签数据集进行分析后获得近似正态分布的特征,通过将噪声标记改为其k近邻标记的方法,滤去部分噪声信息,从而得到相对高质量的数据集。在MULAN平台上使用多个数据集对6种多标签分类算法进行了噪声去除前后的对比测试,实验结果表明,多标签的预处理方法有效提高了分类器的性能。此方法对于分布特征明显的数据集具有较好的适用性。 展开更多
关键词 多标签 分类 正态分布 预处理 KNN
下载PDF
Effective separation of coal gasification fine slag: Role of classification and ultrasonication in enhancing flotation
8
作者 Rui Han Anning Zhou +4 位作者 Ningning Zhang Zhen Li Mengyan Cheng Xiaoyi Chen Tianhao Nan 《International Journal of Mining Science and Technology》 SCIE EI CAS CSCD 2024年第6期867-880,共14页
Effective separation of residual carbon and ash is the basis for the resource utilization of coal gasification fine slag(CGFS).The conventional flotation process of CGFS has the bottlenecks of low carbon recovery and ... Effective separation of residual carbon and ash is the basis for the resource utilization of coal gasification fine slag(CGFS).The conventional flotation process of CGFS has the bottlenecks of low carbon recovery and high collector dosage.In order to address these issues,CGFS sample taken from Shaanxi,China was used as the study object in this paper.A new process of size classification-fine grain ultrasonic pretreatment flotation(SC-FGUF)was proposed and its separation effect was compared with that of wholegrain flotation(WGF)as well as size classification-fine grain flotation(SC-FGF).The mechanism of its enhanced separation effect was revealed through flotation kinetic fitting,flotation flow foam layer stability,particle size composition,surface morphology,pore structure,and surface chemical property analysis.The results showed that compared with WGF,pre-classification could reduce the collector dosage by 84.09%and the combination of pre-classification and ultrasonic pretreatment could increase the combustible recovery by 17.29%and up to 93.46%.The SC-FGUF process allows the ineffective adsorption of coarse residual carbon to collector during flotation stage to be reduced by pre-classification,and the tightly embedded state of fine CGFS particles is disrupted and surface oxidizing functional group occupancy was reduced by ultrasonic pretreatment,thus carbon and ash is easier to be separated in the flotation process.In addition,some of the residual carbon particles were broken down to smaller sizes in the ultrasonic pretreatment,which led to an increase in the stability of flotation flow foam layer and a decrease in the probability of detachment of residual carbon particles from the bubbles.Therefore,SCFGUF could increase the residual carbon recovery and reduce the flotation collector dosage,which is an innovative method for carbon-ash separation of CGFS with good application prospect. 展开更多
关键词 Coal gasification fine slag Size classification Ultrasonic pretreatment FLOTATION Carbon recovery
下载PDF
模糊聚类分析在土壤肥力分类中的应用 被引量:2
9
作者 杜宜霞 《黑龙江水利科技》 2012年第2期8-10,共3页
土壤分类中涉及的许多指标具有模糊性,因此将模糊数学中的模糊聚类分析应用到土壤分类研究中,以期更准确、更合理地区分土壤类型。模糊聚类分析是根据模糊集的理论和方法,通过对样本各类指标的观察值进行数理统计分析处理,最终根据研究... 土壤分类中涉及的许多指标具有模糊性,因此将模糊数学中的模糊聚类分析应用到土壤分类研究中,以期更准确、更合理地区分土壤类型。模糊聚类分析是根据模糊集的理论和方法,通过对样本各类指标的观察值进行数理统计分析处理,最终根据研究目的将各个样本集进行有效分类的一种多元统计方法。在介绍模糊聚类分析理论的基础上,运用模糊聚类分析方法对江汉平原后湖地区的土壤肥力进行分类,验证了该方法在土壤肥力分类中的可行性。 展开更多
关键词 模糊聚类分析 土壤肥力 分类方法 数据预处理 模糊相似 矩阵 绘制聚类图
下载PDF
高校实验室的废物处理方法初探 被引量:1
10
作者 李志群 施艳秀 +1 位作者 郑向红 何丽清 《化纤与纺织技术》 2014年第1期32-36,共5页
对高校实验室废物的分类、预处理和处理作了一些探讨,提出了实验室废物处理的实用方法,供同行参考。
关键词 高校实验室废物 分类 预处理 处理方法
下载PDF
基于分类预处理的协同供应商模糊综合评价 被引量:1
11
作者 黄细燕 徐玉萍 《华东交通大学学报》 2014年第6期126-130,142,共6页
供应商优选是供应链协同管理和供应链竞争力的内在要求。对定性指标采用梯形模糊数处理,并对所有指标进行分类预处理,实现无量纲化并避免设计隶属度函数;构建模糊互补矩阵时对定性指标采用两两比较法,对定量指标采用模糊一致判断矩阵元... 供应商优选是供应链协同管理和供应链竞争力的内在要求。对定性指标采用梯形模糊数处理,并对所有指标进行分类预处理,实现无量纲化并避免设计隶属度函数;构建模糊互补矩阵时对定性指标采用两两比较法,对定量指标采用模糊一致判断矩阵元素与权重之关系式,以提高定量指标数据的区分精度;从而,构建基于梯形模糊数及模糊一致矩阵的协同供应商模糊综合评价方法。案例计算表明,该评价方法对定性指标和定量指标的处理技术更加科学客观,比传统模糊评价方法更合理,能为供应链协同管理中供应商选择提供科学的决策支持。 展开更多
关键词 供应链协同 供应商 模糊综合评价 分类预处理 模糊一致矩阵
下载PDF
有机颜料废水处理工程实例分析 被引量:1
12
作者 吉剑 《化工设计通讯》 CAS 2022年第2期55-57,共3页
有机颜料废水组分复杂,生产环节中产生的组分差异较大的废水需分类收集,通过酸析沉淀、次氯酸钠氧化、脱色剂氧化等方法对各类废水进行预处理,预处理后的废水在调节池重调节水质水量,然后采用两级A/O+终端反应沉淀的处理方式处理综合废... 有机颜料废水组分复杂,生产环节中产生的组分差异较大的废水需分类收集,通过酸析沉淀、次氯酸钠氧化、脱色剂氧化等方法对各类废水进行预处理,预处理后的废水在调节池重调节水质水量,然后采用两级A/O+终端反应沉淀的处理方式处理综合废水。结果表明,当综合调节池进水水质CODCr≤4000mg/L,TN≤120mg/L;氨氮≤85mg/L;盐分≤13000mg/L的情况下,最终废水的CODCr、总氮等各项指标均能达到当地污水处理厂的接管标准。工程实例证明,在高盐分(主要是硫酸盐)的环境下,生化系统对有机物的去除率也可以达到90%以上。 展开更多
关键词 有机颜料 分类预处理 高COD废水 高盐废水 两级A/O生物脱氮
下载PDF
实验室危险废物分类管理及处置实践 被引量:1
13
作者 罗劲松 任雪娇 杨兆标 《云南化工》 CAS 2020年第11期149-151,154,共4页
对实验室产生的危险废物进行细分,研究其细化分类原则、分类预处理技术、处理处置过程中的关键控制点。
关键词 危险废物 实验室 分类 预处理 关键技术
下载PDF
基于模糊聚类的物流数据字典动态分级方法 被引量:1
14
作者 宁丹 刘鸿雁 《鞍山科技大学学报》 CAS 2007年第3期255-257,261,共4页
为提高物流管理信息系统查询效率,根据物流数据库管理系统查询调用数据属性字典的统计信息,提出一种优化属性字典分级的动态方法。描述了该方法的实现并进行了查询效率分析。该方法基于模糊聚类原理,在属性字典表中添加聚类属性项;将数... 为提高物流管理信息系统查询效率,根据物流数据库管理系统查询调用数据属性字典的统计信息,提出一种优化属性字典分级的动态方法。描述了该方法的实现并进行了查询效率分析。该方法基于模糊聚类原理,在属性字典表中添加聚类属性项;将数据繁多的属性字典表按其在选定时间内的属性统计值进行动态归类分级。系统运行实践表明,该方法提高查询效率最高达31.9%,平均达19.3%。 展开更多
关键词 物流管理 操作频度 模糊聚类 动态分级 预处理
下载PDF
印制电路板工厂废水处理工艺案例
15
作者 陈江波 林敏 《印制电路信息》 2016年第8期61-64,共4页
介绍了惠州某家印制板企业升级改造后的废水处理技术。为了使废水能够处理达标排放,实施了分流分类收集,且对不同生产过程中产生的废水进行不同的预处理,最后再与综合废水一起处理。工程实践证明,采用该工艺路线处理后的印制电路板废水... 介绍了惠州某家印制板企业升级改造后的废水处理技术。为了使废水能够处理达标排放,实施了分流分类收集,且对不同生产过程中产生的废水进行不同的预处理,最后再与综合废水一起处理。工程实践证明,采用该工艺路线处理后的印制电路板废水出水水质达到了电镀污染物排放标准,而且系统自动化程度高,操作方便,出水稳定。 展开更多
关键词 印制电路板废水 分类收集 预处理
下载PDF
改进梳理设备与处理工艺,提高再生纤维制成率
16
作者 胡建华 《现代纺织技术》 2013年第3期34-36,共3页
为提高对布角类可回收再生纤维的处理加工利用率,运用棉纺工艺中的纤维分梳原理,对开松、梳理设备进行相关设计和技术改造。对原料进行配料组合、剪切、加油水处理剂、闷仓预处理及预分解开松后,梳理机组加工。获得满足纺纱工艺要求的... 为提高对布角类可回收再生纤维的处理加工利用率,运用棉纺工艺中的纤维分梳原理,对开松、梳理设备进行相关设计和技术改造。对原料进行配料组合、剪切、加油水处理剂、闷仓预处理及预分解开松后,梳理机组加工。获得满足纺纱工艺要求的再生纤维。通过纺纱实践证明,在27.8tex环纺纱配用和48.6tex转杯纺主体使用中,成纱质量良好。从企业经济效益表明,对开松、梳理设备进行相关设计和技术改造,将有效提高处理后纤维的利用价值,使本地区再生纤维利用的传统优势发挥更大的先导作用。 展开更多
关键词 再生纤维 分类 预处理 梳理工艺 梳理设备
下载PDF
煤矿矿区回采巷道围岩稳定性分类的灰色Fuzy聚类分析及应用 被引量:10
17
作者 宁云才 邢中光 《系统工程理论与实践》 EI CSCD 北大核心 1997年第8期115-124,共10页
对回采巷道围岩稳定性分类进行了研究,建立了基于模糊等价关系的灰色Fuzzy聚类分析模型。利用该方法进行的回采巷道围岩稳定性分类,为确定合理的支护方式提供了依据,对提高煤矿的经济效益和社会效益有着重要意义。
关键词 回采巷道 围岩 稳定性 煤矿 模糊聚类分析
原文传递
HTML文本自动分类预处理方法的研究应用 被引量:4
18
作者 刘冬梅 王俊义 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第1期75-78,共4页
研究了HTM L标记对网页内容的修饰作用,以前人理论为基础设计和实现了基于HTM L标记的网页分析和加权策略与算法.经实验比较,加入预处理算法后,提高了分类器的分类效率,验证了所提出方法的有效性.
关键词 网页自动分类 HTML 网页预处理
下载PDF
基于深度学习和支持向量机的文本分类模型 被引量:6
19
作者 何铠 管有庆 龚锐 《计算机技术与发展》 2022年第7期22-27,共6页
NLP(Natural Language Processing,自然语言处理)是人工智能领域的一个主要研究方向,而文本分类是NLP处理技术的重要分支。自然语言处理使计算机、手机等电子设备能够具有识别理解人类语言的能力,由于其自身的复杂性,目前仍有许多技术... NLP(Natural Language Processing,自然语言处理)是人工智能领域的一个主要研究方向,而文本分类是NLP处理技术的重要分支。自然语言处理使计算机、手机等电子设备能够具有识别理解人类语言的能力,由于其自身的复杂性,目前仍有许多技术难点没有被完全攻克,主要包括不断产生的新词、中文词语的一词多义、自然语言的灵活性等问题。该文以期刊论文作为实验数据,研究中文文本分类问题,在传统卷积神经网络模型的基础上提出了一种基于卷积神经网络和支持向量机结合的文本分类模型CNNSVM(Convolutional Neural Network and Support Vector Machine Classifier)。相较于传统方法,CNNSVM增加了注意力机制,简化了模型参数,并使用基于支持向量机的分类器替代传统模型中的softmax层帮助实现文本的分类。实验结果显示,该模型提升了特征词语的提取效果,有效解决了softmax层泛化能力较弱的问题。 展开更多
关键词 自然语言处理 词频算法 中文文本分类 权重预处理 词密度权重
下载PDF
一种基于权重预处理的中文文本分类算法 被引量:5
20
作者 何铠 管有庆 龚锐 《计算机技术与发展》 2022年第3期40-45,53,共7页
文本分类是NLP(natural language processing,自然语言处理)处理技术的重要分支。信息检索、文本挖掘作为自然语言处理领域的关键技术,给人们的生活带来了许多便利,而文本分类正是这些关键技术开展的重要基础。文本分类作为自然语言处... 文本分类是NLP(natural language processing,自然语言处理)处理技术的重要分支。信息检索、文本挖掘作为自然语言处理领域的关键技术,给人们的生活带来了许多便利,而文本分类正是这些关键技术开展的重要基础。文本分类作为自然语言处理研究的一个热点,其主要原理是将文本数据按照一定的分类规则实现自动化分类。目前常见的文本分类方式主要分为基于机器学习和基于深度学习两种,它们的本质是通过计算机自主学习从而提取文本信息中的规则来进行分类。针对数据量较小、硬件运算能力较低的应用场景,往往使用基于机器学习算法而衍生的文本分类模型。该文以期刊论文作为实验数据,研究中文文本分类问题,在改进传统词频算法的基础上提出了一种基于权重预处理的中文文本分类算法PRE-TF-IDF(pre-processing term frequency inverse document frequency)。传统词频算法在对词加权时仅考虑词的出现频率而不考虑词在文本中的位置;PRE-TF-IDF算法在TF-IDF(term frequency inverse document frequency)算法的基础上增加权重预处理和词密度权重两个环节。实验结果显示PRE-TF-IDF算法能够有效提高文本分类的准确性。 展开更多
关键词 自然语言处理 词频算法 中文文本分类 权重预处理 词密度权重
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部