期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
一种基于向量空间模型的文本分类方法 被引量:31
1
作者 李雪蕾 张冬茉 《计算机工程》 CAS CSCD 北大核心 2003年第17期90-92,共3页
介绍的文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。通过分析网页的特点及因特网用户感兴趣的查询信息,提出了一种基于机器学习的、独立于语种的文本分类模型。这一模型的关键算法主要利用字间的相关信息、... 介绍的文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。通过分析网页的特点及因特网用户感兴趣的查询信息,提出了一种基于机器学习的、独立于语种的文本分类模型。这一模型的关键算法主要利用字间的相关信息、词频、页面的标记信息以及对用户的查询信息的浅层语义分析,提取网页特征,并计算可调的词频加权参数和增加特征词的可分性信息,然后通过本类和非本类训练,建立预定义类的特征向量空间,进一步对文本进行分类。这种分类方法在相似文本分类中具有明显的优势。 展开更多
关键词 文本分类 超文本描述语言 可分性判据 层次分类
下载PDF
基于机器学习的文本分类技术研究进展 被引量:388
2
作者 苏金树 张博锋 徐昕 《软件学报》 EI CSCD 北大核心 2006年第9期1848-1859,共12页
文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和评测等方面对其研究进展进行综述评论.... 文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和评测等方面对其研究进展进行综述评论.认为非线性、数据集偏斜、标注瓶颈、多层分类、算法的扩展性及Web页分类等问题是目前文本分类研究的关键问题,并讨论了这些问题可能采取的方法.最后对研究的方向进行了展望. 展开更多
关键词 自动文本分类 机器学习 降维 核方法 未标注集 偏斜数据集 分级分类 大规模文本分类 Web页分类
下载PDF
基于向量空间模型的中文文本层次分类方法研究 被引量:12
3
作者 肖雪 何中市 《计算机应用》 CSCD 北大核心 2006年第5期1125-1126,1133,共3页
在文本分类的类别数量庞大的情况下,层次分类是一种有效的分类途径。针对层次分类的结构特点,考虑到不同的层次对特征选择和分类方法有不同的要求,提出了新的基于向量空间模型的二重特征选择方法FDS以及层次分类算法HTC。二重特征选择... 在文本分类的类别数量庞大的情况下,层次分类是一种有效的分类途径。针对层次分类的结构特点,考虑到不同的层次对特征选择和分类方法有不同的要求,提出了新的基于向量空间模型的二重特征选择方法FDS以及层次分类算法HTC。二重特征选择方法对每一层均进行一次特征选择,并逐层改变特征数量和权重计算方法;HTC算法把分别对粗分和细分更有效的类中心向量法与SVM方法相结合。实验表明,该方法相对于平面分类和一般的层次分类方法,有较高的准确率。 展开更多
关键词 层次分类 向量空间模型 二重特征选择 权重计算
下载PDF
层次化中文文档分类 被引量:6
4
作者 袁时金 李荣陆 +1 位作者 周水庚 胡运发 《通信学报》 EI CSCD 北大核心 2004年第11期55-63,共9页
对层次化中文文档分类进行了研究。采用两种途径进行层次化中文文档分类:第一是按照文档类别的层次结构,将一个大的分类问题分化成若干个小的分类问题,用Bayes分类方法分别建立分类器;第二是将层次化分类问题看成是一个更普遍的多类别... 对层次化中文文档分类进行了研究。采用两种途径进行层次化中文文档分类:第一是按照文档类别的层次结构,将一个大的分类问题分化成若干个小的分类问题,用Bayes分类方法分别建立分类器;第二是将层次化分类问题看成是一个更普遍的多类别、多标注分类问题进行求解,分别利用KNN和基于Boosting的分类方法进行层次化中文文档分类。测试结果显示层次化分类比平面分类能够取得更好的分类效果。 展开更多
关键词 文档分类 属性选择 层次分类 分类器
下载PDF
基于层次分类体系的知识地图自动构建方法研究 被引量:5
5
作者 蒋翠清 幸龙潮 丁胡送 《情报学报》 CSSCI 北大核心 2008年第4期499-505,共7页
知识地图是组织实施知识管理的有效工具。随着组织中知识资源存储量的日益增加,手工编制知识地图的方式显得非常低效,甚至难以完成。针对组织中以文本形式大量存在的显性知识,提出了一种基于层次分类体系的知识地图结构,并提出了一... 知识地图是组织实施知识管理的有效工具。随着组织中知识资源存储量的日益增加,手工编制知识地图的方式显得非常低效,甚至难以完成。针对组织中以文本形式大量存在的显性知识,提出了一种基于层次分类体系的知识地图结构,并提出了一个以层次分类方法为核心的知识地图自动生成方法,用来自动构建符合组织需求的知识地图。最后通过实验验证了该层次分类方法的有效性,并给出结论。 展开更多
关键词 知识地图 自动构建 文本分类 层次分类
下载PDF
层次式文本分类的Nave Bayes改进方法 被引量:1
6
作者 张博锋 苏金树 徐昕 《计算机工程与科学》 CSCD 2008年第4期20-22,49,共4页
Nave Bayes方法在文本分类中的决策强烈依赖于主观选择的样本关于类别的分布。本文利用层次式分类的特点并引入概率条件改进Nave Bayes方法,使其在每个内部类别所属的子类局部数据中进行决策,缓解了全局数据分布对分类器的影响,部... Nave Bayes方法在文本分类中的决策强烈依赖于主观选择的样本关于类别的分布。本文利用层次式分类的特点并引入概率条件改进Nave Bayes方法,使其在每个内部类别所属的子类局部数据中进行决策,缓解了全局数据分布对分类器的影响,部分克服了数据偏斜问题。实验表明,改进方法在层次式分类中的效果较Nave Bayes方法有显著提高。 展开更多
关键词 文本分类 层次式分类 NAIVE BAYES 机器学习 数据偏斜
下载PDF
浙江省网络安全应急预案编制研究 被引量:2
7
作者 严丹 张君 鲍克 《计算机时代》 2018年第2期98-100,共3页
国家网络安全应急预案于今年初发布实施,省级地方政府网络安全应急预案陆续编制完成。介绍了浙江省网络安全应急预案的编制背景,在学习国家预案和比较各省级预案的基础上,介绍了浙江省网络安全应急预案的编制过程。比较了浙江省网络安... 国家网络安全应急预案于今年初发布实施,省级地方政府网络安全应急预案陆续编制完成。介绍了浙江省网络安全应急预案的编制背景,在学习国家预案和比较各省级预案的基础上,介绍了浙江省网络安全应急预案的编制过程。比较了浙江省网络安全应急预案与国家网络安全应急预案的区别,并指出了本预案中存在的不足。 展开更多
关键词 网络安全 应急预案 编制 分级分类
下载PDF
基于概率主题的文本层次分类(英文) 被引量:2
8
作者 权小军 林洋港 +1 位作者 罗奇鸣 陈恩红 《中国科学技术大学学报》 CAS CSCD 北大核心 2009年第8期875-879,共5页
概率主题模型是一种统计生成模型,它从文档集合中抽取一系列主题,并将这些文档表示为不同主题依照一定概率混合而成.通过这种模型发现的主题,能揭示文档的语义信息,在很多领域都有着广泛的应用.为此基于概率主题模型,提出了一种新的层... 概率主题模型是一种统计生成模型,它从文档集合中抽取一系列主题,并将这些文档表示为不同主题依照一定概率混合而成.通过这种模型发现的主题,能揭示文档的语义信息,在很多领域都有着广泛的应用.为此基于概率主题模型,提出了一种新的层次文本分类方法.该方法首先利用Gibbs抽样提取一系列主题,然后计算测试文档和每个类的基于主题的相似度.在20 News Groups数据集上的实验结果表明,该方法的分类性能明显超越支持向量机分类方法. 展开更多
关键词 层次分类 概率主题模型 GIBBS抽样
下载PDF
多尺度光照估计和层次化分类的衣着颜色识别 被引量:1
9
作者 张京 王文中 +2 位作者 李成龙 汤进 罗斌 《安徽大学学报(自然科学版)》 CAS 北大核心 2016年第6期24-30,共7页
衣着颜色是行人最显著的表观特征,在视频监控场景中极易受到光照变化的影响.为此,笔者提出了一种基于多尺度光照估计和层次化分类的衣着颜色识别方法.首先,提出一种多尺度局部反射统计的光照估计模型,通过该模型实现对偏色图像的光照矫... 衣着颜色是行人最显著的表观特征,在视频监控场景中极易受到光照变化的影响.为此,笔者提出了一种基于多尺度光照估计和层次化分类的衣着颜色识别方法.首先,提出一种多尺度局部反射统计的光照估计模型,通过该模型实现对偏色图像的光照矫正;其次,为了精确地识别衣着颜色,设计基于融合多颜色空间特征的层次化分类器;最后,在校园监控场景采集4 998张行人衣着图像(晚上2 052张,白天2 946张)进行对比实验.实验结果表明,该方法能有效提高监控视频中衣着颜色识别准确率且至少提高12.5%. 展开更多
关键词 衣着颜色 光照估计 层次化分类 视频监控 偏色图像
下载PDF
一种面向软件配置管理制品的层次分类方法
10
作者 徐培兴 陈伟 +2 位作者 吴国全 高楚舒 魏峻 《软件学报》 EI CSCD 北大核心 2017年第6期1389-1404,共16页
配置管理工具(configuration management tool,简称CMT)作为运维自动化的组成部分,是实现开发运维一体化(development and operations,简称Dev Ops)的重要支撑技术.当前,互联网开源社区中存在数量众多的CMT脚本制品,但是缺乏有效的层次... 配置管理工具(configuration management tool,简称CMT)作为运维自动化的组成部分,是实现开发运维一体化(development and operations,简称Dev Ops)的重要支撑技术.当前,互联网开源社区中存在数量众多的CMT脚本制品,但是缺乏有效的层次分类管理,给快速检索和高效利用CMT脚本制品带来困难.针对该问题,提出一种面向CMT制品的基于在线非结构化描述文档分析的层次分类方法.该方法利用标签共现性关系(tag co-occurrence)建立层次类别体系,基于描述属性特征,实现对CMT制品的层次分类器;并使用混合的样本划分方式针对数据倾斜问题进行了改进.对超过11 000例训练数据和1 000例测试数据进行实验,结果表明:改进的样本划分方式得到的最佳查准率、查全率、调和平均值分别达到0.81、0.88、0.85,较传统方式查全率提高0.15,调和平均值提高0.06.该结果验证了层次分类方法的有效性. 展开更多
关键词 CMT制品 层次分类 开源社区 开发运维一体化(DevOps)
下载PDF
基于在线属性聚合的海量软件层次分类
11
作者 王涛 王怀民 +3 位作者 尹刚 李翔 杨程 邹鹏 《计算机学报》 EI CSCD 北大核心 2013年第10期2007-2018,共12页
互联网规模的软件资源库正从根本上改变传统的软件开发模式,资源库中海量软件的高效层次分类对基于互联网资源的软件开发具有重要意义.传统软件分类方法基于软件源代码或字节码实现粗粒度的扁平分类,并且只在小规模数据集上进行了验证.... 互联网规模的软件资源库正从根本上改变传统的软件开发模式,资源库中海量软件的高效层次分类对基于互联网资源的软件开发具有重要意义.传统软件分类方法基于软件源代码或字节码实现粗粒度的扁平分类,并且只在小规模数据集上进行了验证.文中提出了一种基于软件在线属性聚合的层次分类方法,设计了一个层次分类框架,基于跨资源库软件在线描述和标签的加权聚合,实现对海量软件的高效层次化分类.文中在超过18 000个开源软件上进行交叉验证,实验结果表明文中提出的在线属性加权聚合方法能显著提高软件分类效果.在粗粒度扁平分类下文中方法能够达到基于源代码/字节码分类近似的性能,而且,与相关工作比较,文中方法实现了涵盖123个更细粒度类别的层次化分类,能够更有效地对海量软件进行分类. 展开更多
关键词 软件资源库 开源软件 层次分类 在线属性
下载PDF
SWO:基于小世界效应的快速搜索算法 被引量:4
12
作者 黄刚 李晋航 贾艳 《计算机科学》 CSCD 北大核心 2011年第7期255-260,共6页
借鉴小世界网络理论中层次树模型和多分类标准建模的理论,设计了一种基于小世界效应的快速搜索算法SWO。采用掩码规则将解空间构造为层次树网络模型,并提出采用相映射的空间与原解空间共同组成双分层标准的建模理论。SWO算法通过对两种... 借鉴小世界网络理论中层次树模型和多分类标准建模的理论,设计了一种基于小世界效应的快速搜索算法SWO。采用掩码规则将解空间构造为层次树网络模型,并提出采用相映射的空间与原解空间共同组成双分层标准的建模理论。SWO算法通过对两种空间网络中长短邻居关系的查询访问,将实验信封推送到目的地,从而找到解空间中的最优值。实验证明,引入映射空间搜索机制可避免算法陷入局部最优,而长邻居关系的访问又加快了算法的收敛速度。通过与遗传算法(GA)、粒子群优化算法(PSO)和差分算法(DE)的对比,SWO算法表现出较强的搜索能力和较高的搜索效率。 展开更多
关键词 小世界优化算法 层次树网络模型 多分类标准建模 分布式搜索
下载PDF
基于感性工学的办公无线鼠标造型设计研究 被引量:2
13
作者 赵项 魏峰 胡志雄 《福建工程学院学报》 CAS 2020年第4期403-408,共6页
为满足青年群体对办公用无线鼠标造型的审美诉求及感性需求,基于感性工学理论,充分探究青年用户办公用无线鼠标的情感意象。首先,焦点小组基于KJ分类法筛选出无线鼠标样本;其次,基于语义差异法分析无线鼠标样本感性词汇对,构建产品造型... 为满足青年群体对办公用无线鼠标造型的审美诉求及感性需求,基于感性工学理论,充分探究青年用户办公用无线鼠标的情感意象。首先,焦点小组基于KJ分类法筛选出无线鼠标样本;其次,基于语义差异法分析无线鼠标样本感性词汇对,构建产品造型感性意象评价体系;最后,从造型、材质和色彩三个方面绘制意象尺度图,结合阶层类别分析法与焦点小组从感性意象中提取设计要素,并推论出匹配的物理特性,应用于无线鼠标造型的方案设计。感性工学理论结合其他设计方法可有效指导产品的研发,也为同类产品的造型优化设计提供了新思路。 展开更多
关键词 感性工学 无线鼠标设计 造型设计 意象尺度法 阶层类别分析法
下载PDF
护士分层管理与分类教育模式在糖尿病健康教育中的应用 被引量:18
14
作者 王群 洪梅花 +1 位作者 刘金莲 张洪君 《护理学杂志》 2012年第19期6-8,共3页
目的探讨护士分层管理下ABC内容分类教育模式在糖尿病健康教育中的应用效果。方法将100例2型糖尿病患者按入院时间分为观察组和对照组各50例,对照组采用传统教育模式进行教育,观察组采用护士分层管理下ABC内容分类的模式进行教育。结果... 目的探讨护士分层管理下ABC内容分类教育模式在糖尿病健康教育中的应用效果。方法将100例2型糖尿病患者按入院时间分为观察组和对照组各50例,对照组采用传统教育模式进行教育,观察组采用护士分层管理下ABC内容分类的模式进行教育。结果出院时观察组患者知识得分及程度、糖尿病相关技能掌握情况显著优于对照组(均P<0.01);两组患者满意度比较,差异无统计学意义(P>0.05)。结论护士分层管理下实施ABC内容分类的教育模式有助于提高健康教育效果。 展开更多
关键词 糖尿病 健康教育 分层管理 ABC内容分类 知识 技能 满意度
下载PDF
生源多元化背景下高职院校分层分类培养 被引量:9
15
作者 张燕 《山西财经大学学报》 CSSCI 北大核心 2022年第S02期82-84,共3页
高教大众化导致高职院校生源结构多样化,不同生源学习能力存在差异,高职院校要提供满足学生个性发展所需的教学。但是,高职院校发展中仍存在生源结构与人才培养模式不匹配,学生就业层次低端化等问题。随着单招等招生方案的实施完善,学... 高教大众化导致高职院校生源结构多样化,不同生源学习能力存在差异,高职院校要提供满足学生个性发展所需的教学。但是,高职院校发展中仍存在生源结构与人才培养模式不匹配,学生就业层次低端化等问题。随着单招等招生方案的实施完善,学生结构层次等显著分化,针对性制定人才培养方案,才能满足高职院校对学生培养的综合要求,促进我国高职教育健康发展。本文阐述高职院校生源多元化对高职教育的影响,分析生源多样化下高职院校教育存在的问题,探讨基于生源多元化的高职院校分层分类培养路径。 展开更多
关键词 高职院校 生源多元化 分层分类培养
原文传递
基于词典约简及多分类算法的文本分类系统的设计与开发 被引量:3
16
作者 白振田 侯汉清 《情报学报》 CSSCI 北大核心 2008年第3期337-343,共7页
文本自动分类是目前机器学习、自然语言处理和信息资源检索领域的研究热点之一。本文在对自动分类的实现技术问题进行探讨的基础上,尝试对自动分类的几个环节提出改进措施。具体包括:采用约简法进行抽词词典的构造,采用投票法进行文... 文本自动分类是目前机器学习、自然语言处理和信息资源检索领域的研究热点之一。本文在对自动分类的实现技术问题进行探讨的基础上,尝试对自动分类的几个环节提出改进措施。具体包括:采用约简法进行抽词词典的构造,采用投票法进行文本特征的选择,采用层次法进行逐层次的分类,采用统计与规则相结合的方法进行分类器的构造等。通过在不同语料库上与传统分类方法的对比测试表明,上述改进措施能够有效提高自动分类的性能,基于这些改进措施所开发的自动分类系统具有大规模文本自动分类的可行性。本文详细讨论了相关改进措施的原理、实现算法、流程及存在的问题。 展开更多
关键词 抽词词典 自动分类 向量空间模型 层次分类 粗糙集
下载PDF
基于多重特征选择和多分类器融合的文本层次分类研究 被引量:2
17
作者 贾美英 杨炳儒 +1 位作者 郑德权 陈庆轩 《计算机应用研究》 CSCD 北大核心 2009年第12期4467-4470,共4页
针对大量电子文档需要准确地进行多层次自动分类管理的现实需求,提出基于多重特征选择和多分类器融合技术的层次分类方法。通过引入可信度函数对单分类器效果进行评价,适时采用辅助分类器对较难分类的文档进行分类投票判决。实验结果表... 针对大量电子文档需要准确地进行多层次自动分类管理的现实需求,提出基于多重特征选择和多分类器融合技术的层次分类方法。通过引入可信度函数对单分类器效果进行评价,适时采用辅助分类器对较难分类的文档进行分类投票判决。实验结果表明,相对于单分类器,该方法无论在平面分类和层次分类语料上都获得了更好的分类精度,且具有较好的时间复杂性,有很好的实际应用前景。 展开更多
关键词 文本自动分类 文本层次分类 多重特征选择 可信度函数 多分类器融合
下载PDF
热力系统整体分析和优化的热量流法 被引量:4
18
作者 赵甜 陈曦 +1 位作者 贺克伦 陈群 《中国科学:技术科学》 EI CSCD 北大核心 2021年第10期1251-1274,共24页
热力系统的性能优化对提高能源利用效率具有重要意义,但传统分析方法难以满足复杂系统高效分析的需求.近年来基于理论发展的热量流法及相应的求解算法为热力系统的分析与优化提供了一种新的解决方案.本文首先介绍热力系统热量流模型的... 热力系统的性能优化对提高能源利用效率具有重要意义,但传统分析方法难以满足复杂系统高效分析的需求.近年来基于理论发展的热量流法及相应的求解算法为热力系统的分析与优化提供了一种新的解决方案.本文首先介绍热力系统热量流模型的规范化构建方法,并以余热回收朗肯循环为例说明了模型构建的具体流程.随后,结合系统中工质的流动约束及物性,提出了热力系统整体数学模型的规范化构建方法,能够分离系统约束中线性、非线性显式和非线性隐式约束,最少化需要迭代求解约束的数量.利用上述约束分离特性提出了热力系统整体数学模型的分层-分治求解算法,能够大幅降低计算复杂度,并显著提高计算鲁棒性.最后,以三压蒸汽发电系统为例,阐明了热量流模型及分层-分治算法与传统求解方法相比在求解时间、所需初值数量等方面的优势. 展开更多
关键词 热力系统 热量流法 规范化建模 分层-分治算法
原文传递
政务数据共享的问题分析及破解之道 被引量:3
19
作者 卢荣婕 《温州大学学报(社会科学版)》 2022年第4期81-88,共8页
政务数据共享能够实现政务数据价值最大化的释放,通过政务数据的互联互通,实现了“数据跑路”替代“相对人跑路”,便利了行政相对人。但目前政务数据共享工作仍推行缓慢,主要原因是政务数据权利类型模糊,政务数据权利构成要素不清晰。... 政务数据共享能够实现政务数据价值最大化的释放,通过政务数据的互联互通,实现了“数据跑路”替代“相对人跑路”,便利了行政相对人。但目前政务数据共享工作仍推行缓慢,主要原因是政务数据权利类型模糊,政务数据权利构成要素不清晰。政务数据共享仍然是数据管理型理念,强调权力本位,容易产生政务数据部门利益化的风险,政务数据标准并不统一。通过优化政务数据的分类标准,采取分级分类式共享,转变政务数据共享理念,建立政务数据权利的归属清单,可有效实现政务数据共享的协调治理,破解当前政务数据共享困境。 展开更多
关键词 政务数据共享 分类分级 数据整合 协同治理
下载PDF
基于“多元智能理论”构建分层分类教学模式研究——以机械设计基础课程为例 被引量:1
20
作者 徐丽娜 《包头职业技术学院学报》 2023年第2期49-52,共4页
文章基于“多元智能理论”,针对高职院校学生的生源情况、知识基础、智力水平、兴趣爱好、个性特征和心理倾向等将学生分成不同的层次,有差异地制定教学目标,重构教学内容,采用科学的教学手段和评价体系进行分层教学,充分调动不同层次... 文章基于“多元智能理论”,针对高职院校学生的生源情况、知识基础、智力水平、兴趣爱好、个性特征和心理倾向等将学生分成不同的层次,有差异地制定教学目标,重构教学内容,采用科学的教学手段和评价体系进行分层教学,充分调动不同层次学生的学习积极性和主动性,使每个学生都能在各自的“最近发展区域”内得到充分的发展,从而达到大面积提高教学质量的目的。使学生都能在原有的基础上学有所得,异步达标。 展开更多
关键词 多元智能理论 高职 分层分类教学
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部