期刊文献+
共找到2,843篇文章
< 1 2 143 >
每页显示 20 50 100
情感词汇本体的构造 被引量:380
1
作者 徐琳宏 林鸿飞 +2 位作者 潘宇 任惠 陈建美 《情报学报》 CSSCI 北大核心 2008年第2期180-185,共6页
情感计算是目前人工智能领域的热门课题,而大规模的情感词汇本体的构造是准确完成文本情感识别的基础。本文首先根据目前情感分类发展的现状,确定情感分类体系,在此基础上综合现有的各种情感词汇资源构造情感词汇本体。在本体的知识... 情感计算是目前人工智能领域的热门课题,而大规模的情感词汇本体的构造是准确完成文本情感识别的基础。本文首先根据目前情感分类发展的现状,确定情感分类体系,在此基础上综合现有的各种情感词汇资源构造情感词汇本体。在本体的知识获取过程中采用手工分类和自动获取相结合的方法填充词汇本体的框架。详细描述了词汇的情感类别、强度和极性等,并进一步统计了情感词汇的分布情况。 展开更多
关键词 情感计算 情感分类 互信息 本体
下载PDF
文本分类中的特征抽取 被引量:73
2
作者 秦进 陈笑蓉 +1 位作者 汪维家 陆汝占 《计算机应用》 CSCD 北大核心 2003年第2期45-46,共2页
特征抽取是用机器学习方法进行文本分类的重点和难点。文中比较了目前几种最常用的特征抽取方法,提出了一种改进型的互信息特征抽取方法。并在构建的实验系统中比较了这几种特征抽取方法,发现改进的特征抽取方法是有效可行的。
关键词 文本分类 特征抽取 信息处理 互信息 文本挖掘 机器学习
下载PDF
基于VMD与PSO优化深度信念网络的短期负荷预测 被引量:121
3
作者 梁智 孙国强 +4 位作者 李虎成 卫志农 臧海祥 周亦洲 陈霜 《电网技术》 EI CSCD 北大核心 2018年第2期598-606,共9页
为提高短期负荷预测精度,采用变分模态分解(variational mode decomposition,VMD)技术将原始历史负荷序列分解为一系列特征互异的模态函数,对每个模态函数进行特征分析并分别建立负荷预测模型。电力系统负荷预测建模过程中,选取有效... 为提高短期负荷预测精度,采用变分模态分解(variational mode decomposition,VMD)技术将原始历史负荷序列分解为一系列特征互异的模态函数,对每个模态函数进行特征分析并分别建立负荷预测模型。电力系统负荷预测建模过程中,选取有效的输入变量是提高预测精度技术措施之一,该文采用互信息度量影响因素与输出变量间的相关性,可选取出对负荷影响较大的输入变量集合。传统的神经网络负荷预测模型难以训练多层网络,从而影响其预测精度。而深度信念网络(deep belief network,DBN)采用非监督贪心逐层训练算法构成多隐含层感知器结构,在回归预测分析中展现出优良的性能,已成为深度学习领域研究热点。因此,该文借助DBN算法对每个模态函数建立预测模型,提高了预测精度。由于DBN网络权值的随机初始化,使得目标函数在学习训练过程中容易陷入局部最优,采用改进粒子群算法优化网络权值,增强了DBN预测性能。最后,算例测试表明该文模型的有效性。 展开更多
关键词 短期负荷预测 变分模态分解 输入变量选择 互信息 粒子群算法 优化深度信念网络
下载PDF
基于互信息的主成分分析特征选择算法 被引量:105
4
作者 范雪莉 冯海泓 原猛 《控制与决策》 EI CSCD 北大核心 2013年第6期915-919,共5页
主成分分析是一种常用的特征选择算法,经典方法是计算各个特征之间的相关,但是相关无法评估变量间的非线性关系.互信息可用于衡量两个变量间相互依赖的强弱程度,且不局限于线性相关,鉴于此,提出一种基于互信息的主成分分析特征选择算法... 主成分分析是一种常用的特征选择算法,经典方法是计算各个特征之间的相关,但是相关无法评估变量间的非线性关系.互信息可用于衡量两个变量间相互依赖的强弱程度,且不局限于线性相关,鉴于此,提出一种基于互信息的主成分分析特征选择算法.该算法计算特征间的互信息,以互信息矩阵的特征值作为评价准则确定主成分的个数,并衡量主成分分析特征选择的效果.通过实例对所提出方法和传统主成分分析方法进行比较,并以神经网络为分类器分析分类效果. 展开更多
关键词 互信息 主成分分析 特征选择
原文传递
采用互信息与随机森林算法的用户用电关联因素辨识及用电量预测方法 被引量:95
5
作者 赵腾 王林童 +1 位作者 张焰 田世明 《中国电机工程学报》 EI CSCD 北大核心 2016年第3期604-614,共11页
随着智能电网的不断发展,电力企业积累的大量数据为用户用电量精细化预测提供了数据基础。针对与用电量预测相关的大数据种类多、体量大、维度高和生成速度快等特点,在研究用户用电特性评价指标的基础上,提出海量用户用电特性子空间聚... 随着智能电网的不断发展,电力企业积累的大量数据为用户用电量精细化预测提供了数据基础。针对与用电量预测相关的大数据种类多、体量大、维度高和生成速度快等特点,在研究用户用电特性评价指标的基础上,提出海量用户用电特性子空间聚类分析方法,挖掘用户多种用电模式。根据不同用电模式对用户进行群体划分,并利用互信息矩阵从区域及行业经济数据、气候条件,以及电力价格等方面辨识与用户群体用电量相关联的因素,进而构建基于随机森林算法的用电量大数据预测模型。该文方法可以有效识别不同用户群体的用电关联因素,规避用电模式差异性为用电量预测带来的不利影响。仿真结果表明,该方法具有较高的预测精度,且适用于大数据分析处理。 展开更多
关键词 大数据 子空间聚类 互信息 关联因素辨识 随机森林 用电量预测
下载PDF
基于最大互信息的多模医学图象配准 被引量:49
6
作者 罗述谦 李响 《中国图象图形学报(A辑)》 CSCD 2000年第7期551-558,共8页
介绍了一种基于最大互信息原理的图象配准技术 .并就实施最大互信息配准法的一些重要技术问题进行了研究 ,其中包括不增加新数据点的格点采样子集、不产生分数灰度值的 PV插值技术和出界点策略等 .该方法在搜索策略上采用了无需计算梯度... 介绍了一种基于最大互信息原理的图象配准技术 .并就实施最大互信息配准法的一些重要技术问题进行了研究 ,其中包括不增加新数据点的格点采样子集、不产生分数灰度值的 PV插值技术和出界点策略等 .该方法在搜索策略上采用了无需计算梯度的 Powell算法 .由于计算互信息的关键技术与有效的搜索策略的结合 ,使得该方法能快速、准确地实现多模医学图象的配准 .用该方法对 7个病人的 41套 CT- MR和 35套 MR- PET3D全脑数据进行了配准 ,结果经美国 Vanderbilt大学评估 ,全部达到亚象素级配准精度 .该方法可以临床应用 . 展开更多
关键词 医学图象 配准 互信息 刚体变换 多模
下载PDF
统计相关性分析方法研究进展 被引量:74
7
作者 樊嵘 孟大志 徐大舜 《数学建模及其应用》 2014年第1期1-12,共12页
系统综述了自19世纪开始至今常用的统计相关性的方法,例如Pearson和Spearman相关系数,CorGc和CovGc相关性及距离相关性方法。重点介绍了2011年提出的MIC方法以及由此引发的毁誉参半的大量评述,旨在揭示这一热点领域的研究面貌。该领域... 系统综述了自19世纪开始至今常用的统计相关性的方法,例如Pearson和Spearman相关系数,CorGc和CovGc相关性及距离相关性方法。重点介绍了2011年提出的MIC方法以及由此引发的毁誉参半的大量评述,旨在揭示这一热点领域的研究面貌。该领域不仅受到统计学家的关注,而且受到了分析大样本和异质数据的应用研究领域的学者们的追捧,例如基因组生物学家和网络信息研究者。这些研究者期望在众多已有方法的理解和剖析中更恰当地付诸应用,并提出新的应用问题来推动新的分析方法的创造。 展开更多
关键词 相关分析 Pearson相关系数 Spearman相关系数 Kendall相关系数 互信息 距离相关 最大信息系数
下载PDF
基于互信息的无监督特征选择 被引量:70
8
作者 徐峻岭 周毓明 +1 位作者 陈林 徐宝文 《计算机研究与发展》 EI CSCD 北大核心 2012年第2期372-382,共11页
在数据分析中,特征选择可以用来降低特征的冗余,提高分析结果的可理解性和发现高维数据中隐藏的结构.提出了一种基于互信息的无监督的特征选择方法(UFS-MI),在UFS-MI中,使用了一种综合考虑了相关度和冗余度的特征选择标准UmRMR(无监督... 在数据分析中,特征选择可以用来降低特征的冗余,提高分析结果的可理解性和发现高维数据中隐藏的结构.提出了一种基于互信息的无监督的特征选择方法(UFS-MI),在UFS-MI中,使用了一种综合考虑了相关度和冗余度的特征选择标准UmRMR(无监督最小冗余最大相关)来评价特征的重要性.相关度和冗余度分别使用互信息来度量特征与潜在类别变量之间的依赖和特征与特征之间的依赖.UFS-MI同时适用于数值型和非数值型特征.在理论上证明了UFS-MI的有效性,实验结果也表明UFS-MI可以达到与传统的特征选择方法相当甚至更好的性能. 展开更多
关键词 特征选择 无监督特征选择 互信息 最小冗余-最大相关 无监督最小冗余-最大相关
下载PDF
基于形状特征点最大互信息的医学图像配准 被引量:44
9
作者 周永新 罗述谦 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2002年第7期654-658,共5页
定义了基于形状特征点的互信息计算公式 ,提出区域增长结合动态聚类算法的形状特征点提取方法 .在使形状特征点互信息最大化完成医学图像配准的过程中 ,引入人机交互 ,缩短了优化过程 ,避免了局部极值 .提出的配准策略具备临床实用性 。
关键词 形状特征点 互信息 医学图像配准 临床诊断 放射治疗 CT
下载PDF
基于无指导学习策略的无词表条件下的汉语自动分词 被引量:37
10
作者 孙茂松 肖明 邹嘉彦 《计算机学报》 EI CSCD 北大核心 2004年第6期736-742,共7页
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统... 探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统计量md ,并引入了峰和谷的概念 ,进而设计了相应的分词算法 .大规模开放测试结果显示 ,该算法关于字间位置的分词正确率为 85 .88% ,较单独使用互信息或t 测试差分别提高了 2 4 7%和 5 6 6 % . 展开更多
关键词 无指导学习 汉语自动分词 汉字Bigram 互信息 t-测试差 线性叠加 统计量 中文信息处理应用系统
下载PDF
智能用电用户行为分析特征优选策略 被引量:63
11
作者 陆俊 朱炎平 +1 位作者 彭文昊 孙毅 《电力系统自动化》 EI CSCD 北大核心 2017年第5期58-63,83,共7页
针对大数据应用背景下用户智能用电行为分类的计算复杂性和特征选择有效性的问题,提出一种基于特征信息量的特征优选策略。首先,以用电特征的互信息量与相关系数作为特征有效性和关联性判据,设计用电特征优选准则。然后,提出一种该准则... 针对大数据应用背景下用户智能用电行为分类的计算复杂性和特征选择有效性的问题,提出一种基于特征信息量的特征优选策略。首先,以用电特征的互信息量与相关系数作为特征有效性和关联性判据,设计用电特征优选准则。然后,提出一种该准则下的用电行为特征优选策略,通过减少特征间的分类信息冗余实现高维特征的降维,并选取有效独立的特征,从而构建用户用电行为聚类精简特征集。最后,基于特征优选策略实现了一种特征自适应的用户用电行为分析方法,完成优化的用户用电行为分析。通过电网实际用电数据验证了所提策略能提高聚类准确率和减少计算复杂性的有效性。 展开更多
关键词 用电行为分析 特征选取 互信息 聚类分析 智能用电
下载PDF
自动文本分类特征选择方法研究 被引量:45
12
作者 张海龙 王莲芝 《计算机工程与设计》 CSCD 北大核心 2006年第20期3840-3841,共2页
文本分类是指根据文本的内容将大量的文本归到一个或多个类别的过程,文本表示技术是文本分类的核心技术之一,而特征选择又是文本表示技术的关键技术之一,对分类效果至关重要。文本特征选择是最大程度地识别和去除冗余信息,提高训练数据... 文本分类是指根据文本的内容将大量的文本归到一个或多个类别的过程,文本表示技术是文本分类的核心技术之一,而特征选择又是文本表示技术的关键技术之一,对分类效果至关重要。文本特征选择是最大程度地识别和去除冗余信息,提高训练数据集质量的过程。对文本分类的特征选择方法,包括信息增益、互信息、2统计量、文档频率、低损降维和频率差法等做了详细介绍、分析、比较研究。 展开更多
关键词 文本分类 特征选择 信息增益 互信息 X^2统计量法 文档频率 低损降维 频率差
下载PDF
基于CSP与SVM算法的运动想象脑电信号分类 被引量:49
13
作者 刘冲 赵海滨 +1 位作者 李春胜 王宏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第8期1098-1101,共4页
针对基于两种不同意识任务(想象左手运动和想象右手运动)的脑机接口,使用共空间模式(common spatial pattern,CSP)算法对BCI 2003竞赛数据进行特征提取;基于滑动时间窗,利用CSP方法对C3,Cz和C4位置的脑电信号进行处理.利用支持向量机对... 针对基于两种不同意识任务(想象左手运动和想象右手运动)的脑机接口,使用共空间模式(common spatial pattern,CSP)算法对BCI 2003竞赛数据进行特征提取;基于滑动时间窗,利用CSP方法对C3,Cz和C4位置的脑电信号进行处理.利用支持向量机对特征进行分类,获得最大分类正确率82.86%,最佳时间点4.09 s,最大互信息0.47 bit,最大互信息陡度0.431 bit/s.与BCI 2003竞赛结果相比,最大互信息陡度有了显著提高,证明该方法更适合BCI实时系统的要求. 展开更多
关键词 脑电信号 脑机接口 共空间模式 支持向量机 互信息 分类时间
下载PDF
基于最大熵和互信息最大化的特征点配准算法 被引量:29
14
作者 张二虎 卞正中 《计算机研究与发展》 EI CSCD 北大核心 2004年第7期1194-1199,共6页
点配准问题在机器视觉、医学图像等领域 ,有着非常重要的应用基础 通过在最大化熵原理的基础上 ,将互信息相似性测度引入到点配准算法中 ,提出了一种新的快速、准确的健壮性的点配准算法 首先建立起表示两个特征点集之间匹配对应关系... 点配准问题在机器视觉、医学图像等领域 ,有着非常重要的应用基础 通过在最大化熵原理的基础上 ,将互信息相似性测度引入到点配准算法中 ,提出了一种新的快速、准确的健壮性的点配准算法 首先建立起表示两个特征点集之间匹配对应关系的联合概率分布匹配矩阵 ,通过最大化熵和互信息最大化 ,建立起一个包含匹配矩阵和空间变换参数的新的能量函数 ,通过确定性退火算法 ,可以获得最优的匹配矩阵和空间变换参数 ,从而解决点的对应性问题和出界点(outliers)确定 实验结果表明 ,算法具有较强的鲁棒性 。 展开更多
关键词 图像配准 能量函数 信息 互信息
下载PDF
以互信息为基础的广义相关系数 被引量:40
15
作者 丁晶 王文圣 赵永龙 《四川大学学报(工程科学版)》 EI CAS CSCD 2002年第3期1-5,共5页
提出了描述变量间包括线性和非线性的相关程度的一种以互信息为基础的广义相关系数指标Rg ,给出三种算法 :等间距法、等概率法和等概率递推法。等概率法计算出的结果与序列的总体概率分布无关 ,分组较为客观、合理 ,计算简便 ,较其他算... 提出了描述变量间包括线性和非线性的相关程度的一种以互信息为基础的广义相关系数指标Rg ,给出三种算法 :等间距法、等概率法和等概率递推法。等概率法计算出的结果与序列的总体概率分布无关 ,分组较为客观、合理 ,计算简便 ,较其他算法更优越。在等概率法基础上 ,通过统计实验途径 。 展开更多
关键词 非线性 广义相关系数 互信息 线性 等概率法 互相关函数 信息 随机变量
下载PDF
基于互信息的中文术语抽取系统 被引量:36
16
作者 张锋 许云 +1 位作者 侯艳 樊孝忠 《计算机应用研究》 CSCD 北大核心 2005年第5期72-73,77,共3页
介绍了一个中文术语自动抽取系统,该系统首先基于互信息计算字串的内部结合强度,从而得到术语候选集;接着从术语候选集中去除基本词,并利用普通词语搭配前缀、后缀信息进一步过滤;最后对术语候选进行词法分析,利用术语的词性构成规则进... 介绍了一个中文术语自动抽取系统,该系统首先基于互信息计算字串的内部结合强度,从而得到术语候选集;接着从术语候选集中去除基本词,并利用普通词语搭配前缀、后缀信息进一步过滤;最后对术语候选进行词法分析,利用术语的词性构成规则进行判别,得到最终的术语抽取结果。实验结果表明,术语抽取正确率为72. 19%,召回率为77. 98%,F 测量为74. 97%。 展开更多
关键词 术语抽取 互信息 语料
下载PDF
基于互信息改进算法的新词发现对中文分词系统改进 被引量:46
17
作者 杜丽萍 李晓戈 +2 位作者 于根 刘春丽 刘睿 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第1期35-40,共6页
提出一种非监督的新词识别方法。该方法利用互信息(PMI)的改进算法——PMIk算法与少量基本规则相结合,从大规模语料中自动识别2~n元网络新词(n为发现的新词最大长度,可以根据需要指定)。基于257MB的百度贴吧语料实验,当PMIk方法的... 提出一种非监督的新词识别方法。该方法利用互信息(PMI)的改进算法——PMIk算法与少量基本规则相结合,从大规模语料中自动识别2~n元网络新词(n为发现的新词最大长度,可以根据需要指定)。基于257MB的百度贴吧语料实验,当PMIk方法的参数为10时,结果精度达到97.39%,比PMI方法提高28.79%,实验结果表明,该新词发现方法能够有效地从大规模网络语料中发现新词。将新词发现结果编纂成用户词典,加载到汉语词法分析系统ICTCLAS中,基于10 KB的百度贴吧语料实验,比加载用户词典前的分词结果准确率、召回率和F值分别提高7.93%,3.73%和5.91%。实验表明,通过进行新词发现能有效改善分词系统对网络文本的处理效果。 展开更多
关键词 新词识别 未登录词 互信息 PMI改进算法 中文分词
下载PDF
500kV电力变压器偏磁振动分析 被引量:44
18
作者 郭洁 黄海 +1 位作者 唐昕 何文林 《电网技术》 EI CSCD 北大核心 2012年第3期70-75,共6页
结合2座500 kV变电站内变压器的振动测试数据进行大型电力变压器直流偏磁振动机制的分析及特征的提取。首先,从变压器振动的基本原理及偏磁原理出发,分析了直流偏磁情况下变压器振动的振动机制,得到了以1个信号工频周期的2个半周期波形... 结合2座500 kV变电站内变压器的振动测试数据进行大型电力变压器直流偏磁振动机制的分析及特征的提取。首先,从变压器振动的基本原理及偏磁原理出发,分析了直流偏磁情况下变压器振动的振动机制,得到了以1个信号工频周期的2个半周期波形及能量差异较大为主要特征并包括50 Hz基频分量增加和信号复杂度增加等特征在内的偏磁振动信号的3个特征。然后,提出相应的信号特征提取方法用于获取偏磁振动的特征。最后,对结合地磁水平分量以及中性点电流直流分量筛选得到的地磁感应电流与直流输电单极运行导致的变压器偏磁振动信号进行频谱与特征提取分析。分析结果验证了提出的直流偏磁特征以及相应的特征提取方法的有效性。 展开更多
关键词 电力变压器 直流偏磁 变压器振动 互信息
下载PDF
基于互信息变量选择的变压器油中溶解气体浓度预测 被引量:44
19
作者 唐勇波 桂卫华 +1 位作者 彭涛 欧阳伟 《仪器仪表学报》 EI CAS CSCD 北大核心 2013年第7期1492-1498,共7页
针对变压器油中溶解气体浓度预测中存在的输入变量选择结果受噪声影响的问题,提出了改进的互信息变量选择和支持向量回归机的油中溶解气体浓度预测方法。首先,对油中溶解气体各变量进行相空间重构,利用独立成分分析方法进行信噪分离;然... 针对变压器油中溶解气体浓度预测中存在的输入变量选择结果受噪声影响的问题,提出了改进的互信息变量选择和支持向量回归机的油中溶解气体浓度预测方法。首先,对油中溶解气体各变量进行相空间重构,利用独立成分分析方法进行信噪分离;然后,提出改进的标准化互信息方法进行输入变量选择,以降低噪声对互信息变量选择的影响;最后,采用支持向量回归机作为预测器对变压器油中溶解气体浓度进行预测。实验结果表明,改进的标准化互信息的输入变量选择结果吻合油劣化热动力学研究结果,具有较优的预测精度和泛化能力。 展开更多
关键词 油中溶解气体 预测 互信息 支持向量回归机 变量选择
下载PDF
基于多属性决策树的电网暂态稳定规则提取方法 被引量:41
20
作者 石访 张林林 +2 位作者 胡熊伟 于之虹 张恒旭 《电工技术学报》 EI CSCD 北大核心 2019年第11期2364-2374,共11页
随着清洁能源接入和交直流混联电网规模的不断扩大,电网调度运行方式更为复杂、多变,基于“在线计算辅助决策+人工经验判断”的调度控制方式已难以满足当前电网需求。提出一种基于暂态稳定裕度指标的多属性决策树方法,通过计算互信息对... 随着清洁能源接入和交直流混联电网规模的不断扩大,电网调度运行方式更为复杂、多变,基于“在线计算辅助决策+人工经验判断”的调度控制方式已难以满足当前电网需求。提出一种基于暂态稳定裕度指标的多属性决策树方法,通过计算互信息对原始电气量进行初步分析,筛选出与系统稳定性关联度较高的特征属性;进而利用线性判别分析方法对所选属性进行最佳投影,获得各决策属性的组合特征;通过暂态稳定裕度指标离散化和样本训练生成决策树,得到可评估预想故障下系统稳定性的通用规则,并利用对决策树的回推分析获得可提高系统稳定性的运行方式调整策略;最后利用IEEE-39节点算例的仿真与分析验证了所提出方法的正确性和有效性。 展开更多
关键词 决策树 互信息 线性判别分析 关联规则 暂态稳定裕度
下载PDF
上一页 1 2 143 下一页 到第
使用帮助 返回顶部