期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
DEA和信息熵改进的评标方法研究 被引量:11
1
作者 曹琳剑 刘炳胜 +1 位作者 王雪青 冯涛 《重庆大学学报(社会科学版)》 CSSCI 北大核心 2011年第2期86-89,共4页
文章从评标改进着手,针对国内现有评标方法单一的现象,提出综合评价的观点。对国内现有评标方式进行类比分析,提出两种方式相结合的评标模式。并根据决策单元多输入多输出的特点建立了评价指标体系。引用信息熵对建筑施工企业投标能力... 文章从评标改进着手,针对国内现有评标方法单一的现象,提出综合评价的观点。对国内现有评标方式进行类比分析,提出两种方式相结合的评标模式。并根据决策单元多输入多输出的特点建立了评价指标体系。引用信息熵对建筑施工企业投标能力进行综合评价,严格界定各个指标的权重,使其更加符合优中选优的原则,且进一步降低了评标中的人为因素,减少了随意性,有利于消除建设项目评标过程中的不良弊端。在对决策单元做出客观、科学评价的基础上提高了评标效率,并结合实际案例进行验证。 展开更多
关键词 建设工程 DEA 信息熵 评价方法
下载PDF
一种改进的TextRank关键词提取算法 被引量:9
2
作者 李志强 潘苏含 +1 位作者 戴娟 胡佳佳 《计算机技术与发展》 2020年第3期77-81,共5页
关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题。现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高。因此,提出了一种改进的TextRank关... 关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题。现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高。因此,提出了一种改进的TextRank关键词提取方法,该方法使用TF-IDF方法与平均信息熵方法计算文本中词语的重要性,然后根据计算结果得到词语的综合权重。利用词语的综合权重改进TextRank算法的节点初始值以及节点概率转移矩阵,通过迭代的方式计算各个节点的权重,直至收敛,从而得到词语的权重信息,选择top N个词语作为关键词输出,实现关键词的提取功能。实验结果表明,相较于传统的TF-IDF方法和TextRank方法,提出的改进后的TextRank关键词提取方法有更好的通用性,提取的关键词的准确率更高。 展开更多
关键词 提取 TF-IDF算法 TextRank算法 平均信息熵 自然语言处理
下载PDF
基于模糊C均值改进的粒化特征加权多标签分类算法 被引量:6
3
作者 柴瑞敏 闫婷 《计算机应用与软件》 北大核心 2018年第6期286-291,共6页
多标签分类中,每个样本拥有多个标签,使得标签间的组合数量呈指数增长,分类过程中不同特征附带的标签分类信息不同,而特征和标签间的相关性常被忽略。为此,提出基于模糊C均值(FCM)改进的粒化特征加权多标签分类算法。该算法依据平均信... 多标签分类中,每个样本拥有多个标签,使得标签间的组合数量呈指数增长,分类过程中不同特征附带的标签分类信息不同,而特征和标签间的相关性常被忽略。为此,提出基于模糊C均值(FCM)改进的粒化特征加权多标签分类算法。该算法依据平均信息熵所得最佳粒化数目对标签空间粒化,由信息增益计算特征对于标签粒的隶属度,由隶属度判断它们之间相关性的大小,将这相关性融入到特征的权重系数中,对特征进行加权,以解决特征与标签的相关性问题和标签组合爆炸问题。在多个数据集上的实验表明:相较于其他经典多标签学习算法,该算法在各项评价指标的整体上取得较好的效果。 展开更多
关键词 模糊C均值聚类 信息增益 平均信息熵 粒化 多标签学习
下载PDF
基于高维聚类的文本大数据挖掘算法仿真 被引量:2
4
作者 郭红建 陈一飞 梅轶群 《计算机仿真》 北大核心 2023年第6期499-503,共5页
文本数据具有规模大,特征维数高等特点。通常含有大量的冗余、空间维度复杂的数据,导致文本大数据信息挖掘困难。因此,提出一种基于高维聚类算法的文本大数据挖掘方法。采用等距离特征映射算法,将多维数据映射到低维空间。通过相空间重... 文本数据具有规模大,特征维数高等特点。通常含有大量的冗余、空间维度复杂的数据,导致文本大数据信息挖掘困难。因此,提出一种基于高维聚类算法的文本大数据挖掘方法。采用等距离特征映射算法,将多维数据映射到低维空间。通过相空间重建,提取大数据的关键特征。以平均信息熵作为衡量聚类项目的标准,多次不断更新本文聚类中心,当平均信息熵为小数值时,利用密度函数确定原始本文聚类中心,实现文本大数据挖掘。实验结果证明,所提方法的F1值在95%以上,说明文本大数据的聚类精准度高,不会出现过度挖掘问题。 展开更多
关键词 聚类算法 平均信息熵 降维处理 相空间重建 文本聚类 特征选择
下载PDF
基于改进TextRank的科技文本关键词抽取方法
5
作者 杨冬菊 胡成富 《计算机应用》 CSCD 北大核心 2024年第6期1720-1726,共7页
针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的词语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用词语的词频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中词语间的概率转移矩阵,通过... 针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的词语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用词语的词频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中词语间的概率转移矩阵,通过迭代计算得到词语的初始得分;然后,利用K-Core(K-Core decomposition)算法挖掘KCore子图得到词语的层级特征,利用平均信息熵特征衡量词语的主题表征能力;最后,在词语初始得分的基础上融合层级特征和平均信息熵特征,从而确定关键词。实验结果表明,在公开数据集上,与TextRank方法和OTextRank(Optimized TextRank)方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了6.5和3.3个百分点;在科技服务项目数据集上,与TextRank方法和OTextRank方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了7.4和3.2个百分点。实验结果验证了所提方法抽取出现频率低但较好表达文本主旨关键词的有效性。 展开更多
关键词 科技文本 关键词抽取 TextRank K-Core图 平均信息熵
下载PDF
改进双边滤波与平均γ矫正的图像增强 被引量:3
6
作者 罗国强 陈家益 《传感技术学报》 CAS CSCD 北大核心 2022年第5期644-649,共6页
为克服现有的图像增强算法存在图像失真和低对比度的不足,提出了一种改进双边滤波与平均γ矫正的图像增强算法。鉴于双边滤波具有良好的边缘保持性能,对其进行改进,并将其作为Retinex的中心环绕函数,以获取原始图像的光照图像和反射图... 为克服现有的图像增强算法存在图像失真和低对比度的不足,提出了一种改进双边滤波与平均γ矫正的图像增强算法。鉴于双边滤波具有良好的边缘保持性能,对其进行改进,并将其作为Retinex的中心环绕函数,以获取原始图像的光照图像和反射图像。分别对多尺度Retinex分解的光照图像进行γ矫正,以增强各尺度光照图像的光照效果。然后对γ矫正后的各尺度光照图像取均值图像以及对各尺度的反射图像取均值图像。最后将均值光照图像和反射图像进行重构输出增强图像。实验结果表明,相对于部分最新增强算法,所提出方法的图像增强性能更好,增强图像的对比度和清晰度更高。 展开更多
关键词 图像增强 改进双边滤波 边缘保持 平均γ矫正 信息熵
下载PDF
基于平均差异度的改进k-prototypes聚类算法 被引量:4
7
作者 石鸿雁 徐明明 《沈阳工业大学学报》 EI CAS 北大核心 2019年第5期555-559,共5页
针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中... 针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中心点选取的随机性,同时利用信息熵确定数值数据的属性权重,并对分类属性度量公式进行改进,给出了一种混合属性数据度量公式.结果表明,改进后的算法具有较高的准确率,能够有效处理混合属性数据. 展开更多
关键词 k-prototypes算法 聚类 初始聚类中心 混合属性数据 平均差异度 信息熵 属性权重 度量公式
下载PDF
基于信息熵的n人合作博弈效益分配模型 被引量:3
8
作者 吴黎军 项海燕 《数学建模及其应用》 2013年第Z2期50-54,共5页
以n人合作博弈的效益分配为主要研究对象,从最大熵原理出发,将数学与物理学原理结合,采用概率论的方法,在只知道n-1方信息的情况下提出新的利益分配方法,克服了Shapley值法所需信息量大的弊端。实例表明,该方法能够用较少的信息得到和Sh... 以n人合作博弈的效益分配为主要研究对象,从最大熵原理出发,将数学与物理学原理结合,采用概率论的方法,在只知道n-1方信息的情况下提出新的利益分配方法,克服了Shapley值法所需信息量大的弊端。实例表明,该方法能够用较少的信息得到和Shapley值法接近的结果,具有很好的科学性和实用性,为合作博弈的效益分配问题提供了新的思路。 展开更多
关键词 合作博弈 信息不完全 利益分配 SHAPLEY值法 最大熵 平均信息熵
下载PDF
Matlab在遥感影像融合及其效果评价中的应用 被引量:3
9
作者 刘源璋 王宁 +1 位作者 黄慧宁 谷胜涛 《地理空间信息》 2011年第3期111-113,190,共3页
随着多源遥感影像融合技术的飞速发展,融合方法也越来越完善,但是相应的融合效果评估还没有统一的标准和规则。主要通过Matlab编程,对2幅融合之后的影像的图像均值,平均梯度,标准差,熵与联合熵,相关系数进行综合的对比,从而比较各种融... 随着多源遥感影像融合技术的飞速发展,融合方法也越来越完善,但是相应的融合效果评估还没有统一的标准和规则。主要通过Matlab编程,对2幅融合之后的影像的图像均值,平均梯度,标准差,熵与联合熵,相关系数进行综合的对比,从而比较各种融合方法的优劣。 展开更多
关键词 影像融合 平均梯度 信息熵 相关系数
下载PDF
基于人工免疫系统的故障诊断方法及其应用 被引量:3
10
作者 张韬 丁永生 +1 位作者 郝矿荣 李晓丽 《系统仿真学报》 CAS CSCD 北大核心 2014年第4期830-835,共6页
提出了一种基于人工免疫系统的在线故障诊断方法,实现人体内抗体库中保留有效记忆抗体及故障类型的实时准确识别的能力。基于人体免疫系统中T细胞和B细胞的理论,将抗体库分为第一抗体库和第二抗体库,第二抗体库的生成依赖于保留有记忆... 提出了一种基于人工免疫系统的在线故障诊断方法,实现人体内抗体库中保留有效记忆抗体及故障类型的实时准确识别的能力。基于人体免疫系统中T细胞和B细胞的理论,将抗体库分为第一抗体库和第二抗体库,第二抗体库的生成依赖于保留有记忆效应的第一抗体库的监测范围。该方法根据平均信息熵和欧氏距离理论,有效地设计了第一抗体集的覆盖范围,保证了探测的效果,并以此为基础生成整个故障诊断的抗体集,以更加有效地实现故障的诊断。提出的故障诊断系统应用于碳纤维生产过程中牵伸系统,结合牵伸环节实时采集的数据信息,得出了较准确的故障识别结论。 展开更多
关键词 人工免疫系统 故障诊断 平均信息熵 抗体记忆 碳纤维生产 牵伸过程
下载PDF
GIS线元的平均熵不确定带 被引量:1
11
作者 李大军 龚健雅 +1 位作者 于海龙 杜道生 《遥感学报》 EI CSCD 北大核心 2004年第1期9-13,共5页
在GIS线元的位置不确定性方面 ,国内外学者已提出了“ε 带”、“e 带”、“g 带”、“H 带”等模型 ,然而就应用而言 ,由于“ε 带”具有不变带宽 ,因而应用最为广泛。但是“ε 带”的宽度往往难以确定 ,从而限制了它的使用范围。在“H... 在GIS线元的位置不确定性方面 ,国内外学者已提出了“ε 带”、“e 带”、“g 带”、“H 带”等模型 ,然而就应用而言 ,由于“ε 带”具有不变带宽 ,因而应用最为广泛。但是“ε 带”的宽度往往难以确定 ,从而限制了它的使用范围。在“H 带”的基础上 ,提出了根据线元的平均信息熵确定“ε 带”宽度的思想 ,建立了线元的平均熵不确定带 。 展开更多
关键词 GIS 线元 平均熵 不确定带 位置不确定性
下载PDF
基于平均信息熵的中文问句关键词提取 被引量:1
12
作者 丁菲菲 杨思春 刘仁金 《皖西学院学报》 2014年第5期46-49,共4页
关键词提取是问答系统中问句分析的重要步骤,它有助于问答系统快速、准确地返回答案。针对现有文献中基于TFIDF等方法在关键词提取准确率及效率方面的不足,提出一种基于平均信息熵的中文问句关键词提取方法。通过加入专业领域词汇,并在... 关键词提取是问答系统中问句分析的重要步骤,它有助于问答系统快速、准确地返回答案。针对现有文献中基于TFIDF等方法在关键词提取准确率及效率方面的不足,提出一种基于平均信息熵的中文问句关键词提取方法。通过加入专业领域词汇,并在停用词过滤的基础上计算问句中每个词的平均信息熵,以词的信息熵值直接体现该词在问句中的重要性;同时在关键词提取过程中,通过设定不同提取比例,并在不同提取比例下观察评价标准值,以最佳提取比例获取更为合适的关键词。实验结果表明,与传统的TFIDF等其他方法相比,该方法的查准率、查全率以及F1测度值都得到显著提高。 展开更多
关键词 自动问答 关键词提取 TFIDF 平均信息熵
下载PDF
基于凸集模型的结构地震多维易损性分析 被引量:1
13
作者 贾大卫 吴子燕 何乡 《计算力学学报》 EI CAS CSCD 北大核心 2020年第6期763-769,共7页
将凸集模型应用于结构的地震多维易损性分析。建立钢筋混凝土框架结构模型,选择最大层间位移角和最大层加速度两种参数建立多维性能极限状态方程。通过平均信息熵理论,获得两种参数的区间估计。考虑椭球模型和区间模型两种形式的凸集模... 将凸集模型应用于结构的地震多维易损性分析。建立钢筋混凝土框架结构模型,选择最大层间位移角和最大层加速度两种参数建立多维性能极限状态方程。通过平均信息熵理论,获得两种参数的区间估计。考虑椭球模型和区间模型两种形式的凸集模型,在标准空间内通过拉丁超立方抽样生成样本点,通过矩阵变换将其映射到凸集空间内,建立结构地震响应的凸集模型。将凸集变量样本点代入极限状态方程,进行了易损性分析。采用概率模型进行对比计算,研究表明,与概率模型相比,当PGA较小时,凸集模型的破坏概率较大,而PGA较大时,凸集模型的破坏概率较小;椭球模型和凸集模型的分析结果差距较小,在各个PGA下破坏概率差值仅为0.05~0.1,因此可以不考虑凸集类型不同对易损性分析结果的差异。 展开更多
关键词 多维易损性 地震 凸集模型 平均信息熵 区间估计
下载PDF
基于灰度和信息熵融合的金属疲劳偏振热像分割算法 被引量:1
14
作者 赵汝海 汪方斌 《激光与光电子学进展》 CSCD 北大核心 2021年第24期252-263,共12页
提出了一种基于图像灰度和信息熵融合的红外偏振热像分割算法。首先运用图像局部平均灰度值与方差加权信息熵,寻找多偏振方位角热像的潜在目标区域并配准;其次用改进的模糊C均值聚类(FCM)算法进行逐一分割,将分割后的热像经集合运算后... 提出了一种基于图像灰度和信息熵融合的红外偏振热像分割算法。首先运用图像局部平均灰度值与方差加权信息熵,寻找多偏振方位角热像的潜在目标区域并配准;其次用改进的模糊C均值聚类(FCM)算法进行逐一分割,将分割后的热像经集合运算后的结果作为支持向量机(SVM)的标签;然后对目标区域和背景区域的数据进行训练得到SVM模型并重新划分模糊区域;最后通过形态学处理去除误分割得到最终分割热像。实验结果表明,所提算法相较于最大熵法、最大类间方差(OTSU)算法、FCM算法,能够得到更高的分割精度,有效地改善图像的错分割现象。 展开更多
关键词 图像处理 平均灰度 信息熵 红外图像 金属疲劳
原文传递
基于中文专利的产业概念层次体系构建方法研究
15
作者 李贞贞 钟永恒 《情报杂志》 CSSCI 北大核心 2020年第9期73-80,共8页
[目的/意义]构建丰富的产业概念层次体系,有助于对产业数据资源进行有序组织,研究构建过程中关键词识别与层级关系确定的方法。[方法/过程]以产业中文专利数据为来源,引入平衡语料与平均信息熵提取通用词并过滤;融合位置、词性、TF-IDF... [目的/意义]构建丰富的产业概念层次体系,有助于对产业数据资源进行有序组织,研究构建过程中关键词识别与层级关系确定的方法。[方法/过程]以产业中文专利数据为来源,引入平衡语料与平均信息熵提取通用词并过滤;融合位置、词性、TF-IDF与外部知识库特征,改进TextRank模型有效识别关键词;最后结合产业专家知识、深度学习和近邻传播聚类(AP)算法生成产业概念层次体系。[结果/结论]实验选取“汽车制造”产业进行实证分析,结果显示在关键词抽取上较传统方法有了明显的提高,自动生成的三层次体系包含6个一级关键词和23个二级关键词。该方法能够有效提升构建效率,实现高效的动态更新,为产业数据资源科学管理提供新思路。 展开更多
关键词 产业概念层次体系 中文专利 TextRank模型 近邻传播聚类算法 通用词 平均信息熵
下载PDF
融合多特征的TextRank关键词抽取方法 被引量:33
16
作者 李航 唐超兰 +1 位作者 杨贤 沈婉婷 《情报杂志》 CSSCI 北大核心 2017年第8期183-187,共5页
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档... [目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模型词汇节点的初始权重以及概率转移矩阵,再通过迭代法实现关键词的抽取。[结果 /结论]该研究方法结合了文档集整体信息和单文档自身信息,其关键词提取的准确率较传统TextRank方法、TFIDF-TextRank方法有了明显的提高。 展开更多
关键词 TextRank算法 关键词抽取 神经网络 平均信息熵
下载PDF
基于后悔理论及EDAS法的概率语言多属性群决策方法 被引量:4
17
作者 童玉珍 王应明 《计算机应用》 CSCD 北大核心 2020年第11期3152-3158,共7页
针对属性权重未知的群体决策问题,提出基于离平均方案(平均解)距离的评价方法(EDAS)及考虑决策者后悔规避心理行为的概率语言术语集(PLTS)多属性群决策方法。首先,根据PLTS的相关性质定义概率语言术语集信息熵及交叉熵并建立属性权重模... 针对属性权重未知的群体决策问题,提出基于离平均方案(平均解)距离的评价方法(EDAS)及考虑决策者后悔规避心理行为的概率语言术语集(PLTS)多属性群决策方法。首先,根据PLTS的相关性质定义概率语言术语集信息熵及交叉熵并建立属性权重模型;然后,将群体满意度公式拓展到概率语言术语集环境下,并用于后悔理论中效用值的计算;随后,基于概率语言术语集的属性权重确定模型及群体满意度公式,将后悔理论与EDAS法相结合提出新的多属性决策方法,并对各备选方案进行选择排序;最后,以实例网络舆情突发事件的选择排序为实例对所提出的方法进行验证,并通过对比分析来证明所提方法的有效性。 展开更多
关键词 概率语言术语集 后悔理论 离平均方案(平均解)距离的评价方法 信息熵 网络舆情突发事件
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部