期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于投影寻踪和最优分割的企业信用评级模型 被引量:20
1
作者 张目 周宗放 《运筹与管理》 CSCD 北大核心 2011年第6期226-231,共6页
提出一种基于投影寻踪和最优分割的企业信用评级模型。该模型运用投影寻踪对样本企业进行信用综合评分,将信用综合得分由大到小排序,生成有序样品序列;利用最优分割法对有序样品进行聚类,得出明确的聚类结果;将最优分割点对应的信用综... 提出一种基于投影寻踪和最优分割的企业信用评级模型。该模型运用投影寻踪对样本企业进行信用综合评分,将信用综合得分由大到小排序,生成有序样品序列;利用最优分割法对有序样品进行聚类,得出明确的聚类结果;将最优分割点对应的信用综合得分作为划分信用等级的阈值,从而实现对样本企业的信用评级。应用实例证明了该模型的可行性和有效性。 展开更多
关键词 金融工程 信用评级 投影寻踪 最优分割 聚类分析 企业信用风险
下载PDF
基于GeoHash的电磁大数据航迹挖掘 被引量:15
2
作者 李高云 旷生玉 +1 位作者 江果 何欢 《电子信息对抗技术》 2020年第4期23-27,共5页
物理空间是事物运行的主要维度,各种活动都受到空间维度的影响,在军事领域开展空间数据挖掘应用前景尤为广阔。针对电磁领域产生的海量空间信息关联数据,充分利用Geo-Hash具有的多层次递归、唯一性和降维编码特点,开展了基于GeoHash的... 物理空间是事物运行的主要维度,各种活动都受到空间维度的影响,在军事领域开展空间数据挖掘应用前景尤为广阔。针对电磁领域产生的海量空间信息关联数据,充分利用Geo-Hash具有的多层次递归、唯一性和降维编码特点,开展了基于GeoHash的目标典型航迹提取算法和多目标航迹重合度计算研究。该算法原理清晰、高效简洁,在电磁大数据挖掘工程项目中进行了应用效果检验。 展开更多
关键词 GeoHash 电磁大数据 重合度 挖掘提取 区域聚类
下载PDF
云模型与用户聚类的个性化推荐 被引量:11
3
作者 李克潮 凌霄娥 《计算机应用》 CSCD 北大核心 2013年第10期2804-2806,2826,共4页
针对传统推荐系统数据稀疏、相似性计算方法导致共同评分用户少的问题,提出利用云模型定性概念与定量数值转换的优势,研究云模型、用户聚类的个性化推荐改进算法。用户对项目属性评价的偏好,转换为用户对加权综合云模型表示的数字特征... 针对传统推荐系统数据稀疏、相似性计算方法导致共同评分用户少的问题,提出利用云模型定性概念与定量数值转换的优势,研究云模型、用户聚类的个性化推荐改进算法。用户对项目属性评价的偏好,转换为用户对加权综合云模型表示的数字特征的偏好。利用改进的聚类算法,对评分数据、原始用户属性标准化后的信息进行聚类;同时考虑用户兴趣的变化,结合用户之间项目属性评价的综合云模型的相似度、用户对项目评分的聚类、用户属性聚类这三种方法产生的邻居用户的并集进行推荐。理论分析和实验结果表明,提出的改进算法不但解决数据稀疏性带来的共同评分用户少的弊端,即使是在新用户的情况下,仍能获得较低的平均绝对误差和平均平方误差。 展开更多
关键词 综合云模型 属性评价 评分聚类 属性聚类 协同过滤
下载PDF
我国商业银行信用风险评级实证分析 被引量:5
4
作者 张贵清 刘树林 《河北经贸大学学报》 2005年第4期41-45,共5页
以商业银行贷款数据为基础,采用聚类分析、多元判别和Logistic回归方法构建了我国商业银行的信用风险评级模型。实证检验表明这三种方法都能较准确地对商业银行的信用风险评级资料进行预测。对正常、关注、次级、可疑、损失五类不同样... 以商业银行贷款数据为基础,采用聚类分析、多元判别和Logistic回归方法构建了我国商业银行的信用风险评级模型。实证检验表明这三种方法都能较准确地对商业银行的信用风险评级资料进行预测。对正常、关注、次级、可疑、损失五类不同样本的总体预测精度分别为83.4%、72.05%和68.14%。三种方法对五类不同样本的预测存在相同的趋势,即对正常类和损失类样本的预测准确率较高,对中间三类样本的预测准确率较低。 展开更多
关键词 信用风险 信用评级 逻辑回归 判别分析 聚类分析
下载PDF
因子分析与聚类分析在企业信用评级中的应用 被引量:8
5
作者 奚胜田 詹原瑞 韩著钊 《中国农机化》 北大核心 2009年第1期44-47,共4页
运用多元统计中的因子分析和聚类分析方法,对在沪深交易所上市的33家农业机械和建筑机械行业的生产企业进行信用评级分析。先用因子分析方法从选取的变量中找出合适的因子,计算出各个企业的因子得分,然后将这些因子作为变量,进行聚类分... 运用多元统计中的因子分析和聚类分析方法,对在沪深交易所上市的33家农业机械和建筑机械行业的生产企业进行信用评级分析。先用因子分析方法从选取的变量中找出合适的因子,计算出各个企业的因子得分,然后将这些因子作为变量,进行聚类分析,并对照标准普尔(S&P)的评级体系确定各个企业的评级级别。 展开更多
关键词 信用评级 多元统计 因子分析 聚类分析
下载PDF
Enhancing Multicriteria-Based Recommendations by Alleviating Scalability and Sparsity Issues Using Collaborative Denoising Autoencoder
6
作者 S.Abinaya K.Uttej Kumar 《Computers, Materials & Continua》 SCIE EI 2024年第2期2269-2286,共18页
A Recommender System(RS)is a crucial part of several firms,particularly those involved in e-commerce.In conventional RS,a user may only offer a single rating for an item-that is insufficient to perceive consumer prefe... A Recommender System(RS)is a crucial part of several firms,particularly those involved in e-commerce.In conventional RS,a user may only offer a single rating for an item-that is insufficient to perceive consumer preferences.Nowadays,businesses in industries like e-learning and tourism enable customers to rate a product using a variety of factors to comprehend customers’preferences.On the other hand,the collaborative filtering(CF)algorithm utilizing AutoEncoder(AE)is seen to be effective in identifying user-interested items.However,the cost of these computations increases nonlinearly as the number of items and users increases.To triumph over the issues,a novel expanded stacked autoencoder(ESAE)with Kernel Fuzzy C-Means Clustering(KFCM)technique is proposed with two phases.In the first phase of offline,the sparse multicriteria rating matrix is smoothened to a complete matrix by predicting the users’intact rating by the ESAE approach and users are clustered using the KFCM approach.In the next phase of online,the top-N recommendation prediction is made by the ESAE approach involving only the most similar user from multiple clusters.Hence the ESAE_KFCM model upgrades the prediction accuracy of 98.2%in Top-N recommendation with a minimized recommendation generation time.An experimental check on the Yahoo!Movies(YM)movie dataset and TripAdvisor(TA)travel dataset confirmed that the ESAE_KFCM model constantly outperforms conventional RS algorithms on a variety of assessment measures. 展开更多
关键词 Recommender systems multicriteria rating collaborative filtering sparsity issue scalability issue stacked-autoencoder Kernel Fuzzy C-Means clustering
下载PDF
综合时间及评分因素的电影评分预测方法 被引量:2
7
作者 周文乐 朱明 蒋旦 《电子技术(上海)》 2015年第8期72-77,共6页
提出一种改进的基于对分网络的评分预测方法,首先将用户对项目的行为记录利用对分网络来表示,利用对分网络的结构特征来设计算法。算法综合时间因素、评分差以及网络的路径信息,挖掘用户-项目对分网络顶点之间的关联性,计算用户之间的... 提出一种改进的基于对分网络的评分预测方法,首先将用户对项目的行为记录利用对分网络来表示,利用对分网络的结构特征来设计算法。算法综合时间因素、评分差以及网络的路径信息,挖掘用户-项目对分网络顶点之间的关联性,计算用户之间的相似度,利用谱聚类算法建用户聚类为兴趣组,最后利用邻居用户的评分信息预测用户对未知项目的评分。在标准数据库上验证此方法的有效性,结果证明,方法的平均绝对误差低于对比方法达0.07以上。 展开更多
关键词 对分网络 评分预测 谱聚类 兴趣组
原文传递
Characteristics Classification of Mobile Apps on Apple Store Using Clustering
8
作者 Boxi Fu 《Journal of Data Analysis and Information Processing》 2020年第2期69-85,共17页
This research is interested in the user ratings of Apps on Apple Stores. The purpose of this research is to have a better understanding of some characteristics of the good Apps on Apple Store so Apps makers can potent... This research is interested in the user ratings of Apps on Apple Stores. The purpose of this research is to have a better understanding of some characteristics of the good Apps on Apple Store so Apps makers can potentially focus on these traits to maximize their profit. The data for this research is collected from kaggle.com, and originally collected from iTunes Search API, according to the abstract of the data. Four different attributes contribute directly toward an App’s user rating: rating_count_tot, rating_count_ver, user_rating and user_rating_ver. The relationship between Apps receiving higher ratings and Apps receiving lower ratings is analyzed using Exploratory Data Analysis and Data Science technique “clustering” on their numerical attributes. Apps, which are represented as a data point, with similar characteristics in rating are classified as belonging to the same cluster, while common characteristics of all Apps in the same clusters are the determining traits of Apps for that cluster. Both techniques are achieved using Google Colab and libraries including pandas, numpy, seaborn, and matplotlib. The data reveals direct correlation from number of devices supported and languages supported to user rating and inverse correlation from size and price of the App to user rating. In conclusion, free small Apps that many different types of users are able to use are generally well rated by most users, according to the data. 展开更多
关键词 MOBILE APPS clustering User rating Pairplot SCATTER PLOT FUNCTIONALITY
下载PDF
Islands of misfit buildings: Detecting uncharacteristic electricity use behavior using load shape clustering 被引量:1
9
作者 Matias Quintana Pandarasamy Arjunan Clayton Miller 《Building Simulation》 SCIE EI CSCD 2021年第1期119-130,共12页
Many energy performance analysis methodologies assign buildings a descriptive label that represents their main activity,often known as the primary space usage(PSU).This attribute comes from the intent of the design te... Many energy performance analysis methodologies assign buildings a descriptive label that represents their main activity,often known as the primary space usage(PSU).This attribute comes from the intent of the design team based on assumptions of how the majority of the spaces in the building will be used.In reality,the way a building’s occupants use the spaces can be different than what was intended.With the recent growth of hourly electricity meter data from the built environment,there is the opportunity to create unsupervised methods to analyze electricity consumption behavior to understand whether the PSU assigned is accurate.Misclassification or oversimplification of the use of the building is possible using these labels when applied to simulation inputs or benchmarking processes.To work towards accurate characterization of a building’s utilization,we propose a modular methodology for identifying potentially mislabeled buildings using distance-based clustering analysis based on hourly electricity consumption data.This method seeks to segment buildings according to their daily behavior and predict which ones are misfits according to their assigned PSU label.This process finds potentially uncharacteristic behavior that could be an indication of mixed-use or a misclassified PSU.Our results on two public data sets,from the Building Data Genome(BDG)Project and Washington DC(DGS),with 507 and 322 buildings respectively,show that 26%and 33%of these buildings are potentially mislabelled based on their load shape behavior.Such information provides a more realistic insight into their true consumption characteristics,enabling more accurate simulation scenarios.Applications of this process and a discussion of limitations and reproducibility are included. 展开更多
关键词 uncharasteristic behaviour building energy use building energy benchmarking building performance rating primary-use-type analysis load profile clustering
原文传递
相似性与置信系数为基础的推荐系统评分预测 被引量:1
10
作者 苏湛 王佳伟 +1 位作者 艾均 沈昱明 《小型微型计算机系统》 CSCD 北大核心 2021年第5期984-989,共6页
邻居选择和邻居数量对于推荐系统评分预测具有关键作用.本文采用复杂网络模型中多种聚类方法,针对现有方法通常基于单一相似性选择邻居的问题,建立用户为节点,相似性与置信系数为边的复杂网络模型,设计基于两个因素聚类的推荐系统评分... 邻居选择和邻居数量对于推荐系统评分预测具有关键作用.本文采用复杂网络模型中多种聚类方法,针对现有方法通常基于单一相似性选择邻居的问题,建立用户为节点,相似性与置信系数为边的复杂网络模型,设计基于两个因素聚类的推荐系统评分预测算法,以提高推荐系统的预测准确性并减少最优预测所需的邻居数量.实验通过折十验证仿真用户对电影进行评分.结果表明,本文方法达到最优预测准确度时,预测所需邻居数量减少60%.研究揭示了基于置信系数和相似性对邻居进行聚类,可以更加有效选出适当邻居,且聚类方法进行适当化简对性能影响较小. 展开更多
关键词 推荐系统 评分预测 相似度 置信系数 邻居聚类
下载PDF
基于时态聚类模糊综合评价的基金评级算法
11
作者 孟志青 金诗思 《浙江工业大学学报》 CAS 北大核心 2021年第5期520-531,共12页
基金评级指标数据是一种具有时间属性的时态数据,被评定的基金级别是随着时间变化的,因此,如何给出一个客观的基金评价方法是非常困难的问题。通过对基金数据在时间粒度上的变换,改进了模糊综合评价法,建立了一种新的基于时态聚类模糊... 基金评级指标数据是一种具有时间属性的时态数据,被评定的基金级别是随着时间变化的,因此,如何给出一个客观的基金评价方法是非常困难的问题。通过对基金数据在时间粒度上的变换,改进了模糊综合评价法,建立了一种新的基于时态聚类模糊综合评价的基金评级算法(以下简称TCF算法)。针对科技、传媒及通讯类行业基金进行了实证分析,从准确性和稳定性两个角度表明:TCF算法具有良好的适用性,同时随着时间的变化,采用TCF算法所得到的评级结果比其他基金评级机构的评级结果更优,因此该算法对提高证券基金评级的准确性有一定的帮助,能为基金评价理论提供一种新的算法。 展开更多
关键词 时态数据 基金评级 模糊综合评价 时态聚类
下载PDF
国有商业银行信贷评级模型的构建及实证检验 被引量:16
12
作者 肖北溟 《金融论坛》 CSSCI 2004年第4期16-21,共6页
信贷评级是信贷风险管理的前提,目前我国国有商业银行都采用这一方式管理信贷风险。本文在对国有商业银行当前信用评级方法存在问题和国内外相关研究成果进行分析的基础上,提出了构建国有商业银行内部信用评级模型,提高信贷风险管理水... 信贷评级是信贷风险管理的前提,目前我国国有商业银行都采用这一方式管理信贷风险。本文在对国有商业银行当前信用评级方法存在问题和国内外相关研究成果进行分析的基础上,提出了构建国有商业银行内部信用评级模型,提高信贷风险管理水平的建议。作者利用贷款历史数据,通过因子分析和聚类分析等方法构建内部信用评级模型:通过因子分析方法构建的模型使评级指标体系更加科学、合理,避免了反映风险信息的冗余与遗漏;聚类分析使评级模型直接与违约概率挂钩,度量风险的准确性进一步提高。论文最后对模型进行了实证分析,使其有效性得到了检验。 展开更多
关键词 国有商业银行 信贷评级模型 因子分析法 聚类分析法 穆迪公司 内部评级系统 中国
下载PDF
一种改进的top-N协同过滤推荐算法 被引量:33
13
作者 肖文强 姚世军 吴善明 《计算机应用研究》 CSCD 北大核心 2018年第1期105-108,112,共5页
针对传统的相似度计算方法仅依靠用户评分信息矩阵来计算物品或用户相似度,物品相似度的计算考虑了所有用户的历史反馈信息等问题,提出一种改进的协同过滤推荐算法。以所有物品的度的平均值作为阈值,在用户相似度计算公式中引入用户共... 针对传统的相似度计算方法仅依靠用户评分信息矩阵来计算物品或用户相似度,物品相似度的计算考虑了所有用户的历史反馈信息等问题,提出一种改进的协同过滤推荐算法。以所有物品的度的平均值作为阈值,在用户相似度计算公式中引入用户共同评分权重以及流行物品权重;在物品相似度计算公式中引入物品时间差因素和用户共同评分权重。将兴趣相似的用户聚成一类,在类内应用推荐算法分别为用户进行推荐。实验结果表明,相比于传统的协同过滤推荐算法,新算法得到的推荐结果在召回率上提高了2.1%。该算法可在一定程度上提高推荐算法的精度以及推荐质量。 展开更多
关键词 协同过滤推荐算法 用户评分信息 相似度 聚类算法 召回率
下载PDF
基于数据挖掘聚类技术的信用评分评级 被引量:9
14
作者 左子叶 朱扬勇 《计算机应用与软件》 CSCD 北大核心 2004年第4期1-3,101,共4页
本文提出了一个基于数据挖掘聚类技术的信用评分评级方法。该方法使用数据挖掘的聚类算法 ,对传统信用评分模型进行了改进 ,本文给出了方法的理论证明 ,并在一个信用卡分析系统DMCA中实现了该方法 ,进行了详细的数据测试。理论证明及实... 本文提出了一个基于数据挖掘聚类技术的信用评分评级方法。该方法使用数据挖掘的聚类算法 ,对传统信用评分模型进行了改进 ,本文给出了方法的理论证明 ,并在一个信用卡分析系统DMCA中实现了该方法 ,进行了详细的数据测试。理论证明及实验结果都表明 ,聚类技术在传统信用评分模型的DM/MTM ,分界值 ,均方差 。 展开更多
关键词 信用评分 信用评级 数据挖掘 聚类 DM/MIM 信用卡分析系统
下载PDF
智能电能表综合性能评级方法研究 被引量:6
15
作者 姜洪浪 赵婷 +3 位作者 段晓萌 左嘉 王晓东 王爽 《电测与仪表》 北大核心 2018年第6期105-109,115,共6页
针对目前国内智能电能表综合性能评价缺失的情况,提出一种基于数据挖掘方法的智能电能表综合性能评级方法。基于大量智能电能表样本的全性能试验数据,选取代表性试验项目数据作为性能评级指标,利用主成分法分析某一评级指标下不同试验... 针对目前国内智能电能表综合性能评价缺失的情况,提出一种基于数据挖掘方法的智能电能表综合性能评级方法。基于大量智能电能表样本的全性能试验数据,选取代表性试验项目数据作为性能评级指标,利用主成分法分析某一评级指标下不同试验点的影响程度,给出不同试验点的权重值,通过加权处理获得各评级指标数据,得到评级指标矩阵。采用k均值聚类分析法构建智能电能表综合性能评级模型,对所选各样表性能给出评级结果。最后随机选取三个不同电能表厂家的样表,结合电能表现场故障率统计情况等分析其评级结果分布,验证了该评级方法对电能表综合性能评级的合理性及可靠性。 展开更多
关键词 智能电能表 综合性能评级 主成分分析 K均值聚类
下载PDF
一种修正评分偏差并精细聚类中心的协同过滤推荐算法 被引量:1
16
作者 马鑫 段刚龙 《统计与决策》 CSSCI 北大核心 2024年第4期23-27,共5页
协同过滤作为国内外学者普遍关注的推荐算法之一,受评分失真、数据稀疏等问题影响,算法推荐效果不尽如人意。为解决上述问题,文章提出了一种改进的聚类协同过滤推荐算法。首先,该算法利用无监督情感挖掘技术将评论情感映射为一个固定区... 协同过滤作为国内外学者普遍关注的推荐算法之一,受评分失真、数据稀疏等问题影响,算法推荐效果不尽如人意。为解决上述问题,文章提出了一种改进的聚类协同过滤推荐算法。首先,该算法利用无监督情感挖掘技术将评论情感映射为一个固定区间中的值,通过加权修正用户评分偏差;然后,构建修正后用户-产品评分矩阵的数据场,利用启发式寻优算法计算最佳聚类数和最优初始聚类中心,进而对用户进行划分聚类,结合最近邻用户相似性与评分产生推荐结果;最后,基于三个自建真实数据集对所提算法性能和有效性进行全面评估。实验结果表明,改进算法在精度Precision、召回率Recall和F1-Score评价指标上的表现均优于其他算法,能够有效应对数据稀疏的问题,提升推荐系统的推荐效果。 展开更多
关键词 评分偏差 随机初始聚类中心 协同过滤 评论情感挖掘 数据场聚类
下载PDF
模糊聚类法在专题数据分级中的应用 被引量:3
17
作者 蔡畅 刘川 吴国荣 《测绘与空间地理信息》 2008年第6期11-13,共3页
在对专题数据的处理中,运用模糊聚类分析法对其建立相似矩阵,以截集法进行分类分级,并对加权聚类法的应用进行了详细的探讨。
关键词 模糊聚类 数据分级 截集 加权聚类
下载PDF
基于项目评分行为序列的群组攻击检测算法 被引量:2
18
作者 胡玉琦 李雪 曲越奇 《燕山大学学报》 CAS 北大核心 2021年第1期87-94,共8页
在推荐系统中,攻击用户的行为正逐渐从个体攻击转变为群组攻击。相对于个体攻击用户而言,攻击群组的迷惑性更强,威胁性更大。针对这种情况,本文提出了一种基于评分行为序列的群组攻击检测算法。该算法通过对每个项目提取评分行为序列,... 在推荐系统中,攻击用户的行为正逐渐从个体攻击转变为群组攻击。相对于个体攻击用户而言,攻击群组的迷惑性更强,威胁性更大。针对这种情况,本文提出了一种基于评分行为序列的群组攻击检测算法。该算法通过对每个项目提取评分行为序列,划分评分行为区间作为候选群组,然后根据攻击群组评分极端的特性、利用层次聚类筛选候选群组,并计算可疑度,最后再使用K-means聚类判定攻击群组,并在Amazon数据集和Netflix数据集上验证了该算法的有效性。 展开更多
关键词 推荐系统 群组攻击 评分行为序列 层次聚类 K-MEANS聚类
下载PDF
我国房地产上市公司信用评级研究——基于BP神经网络方法 被引量:3
19
作者 李海姣 黄健青 《上海立信会计金融学院学报》 2020年第2期15-26,共12页
选取2017年我国房地产上市公司的财务与非财务数据,构建行业信用风险评价指标体系,运用因子分析法计算各公司的综合得分Z值,利用K-Means进行聚类分析,确定信用评级基准。以2017年的样本数据为基础建立BP神经网络,将上市房企评级结果作... 选取2017年我国房地产上市公司的财务与非财务数据,构建行业信用风险评价指标体系,运用因子分析法计算各公司的综合得分Z值,利用K-Means进行聚类分析,确定信用评级基准。以2017年的样本数据为基础建立BP神经网络,将上市房企评级结果作为目标输出值,训练获得精度最优网络。套用该模型对2018年我国上市房企的信用评级进行仿真测试,拟合优度达0.734。研究结果表明:在近年经济下行与房地产市场宏观调控背景下,上市房企整体信用水平下降;上市房企的信用评级越优,其市场表现越好。因此,投资者可将上市房企的信用评级作为有效参考标准,以降低投资风险。 展开更多
关键词 房地产上市公司 信用评级 因子分析 K-Means聚类分析 BP神经网络
下载PDF
基于机器学习的信贷风险量化与决策分析 被引量:2
20
作者 王沼翔 葛琳 《软件工程》 2021年第12期40-44,34,共6页
中小微企业在发展过程中需要信贷融资,然而部分企业的不良贷款会对金融稳定构成威胁。针对此问题,可以通过对企业相关财务数据进行分析,从源头上防范和降低信贷风险。本文采用熵权法、数据统计分析法、K均值聚类和BP神经网络等机器学习... 中小微企业在发展过程中需要信贷融资,然而部分企业的不良贷款会对金融稳定构成威胁。针对此问题,可以通过对企业相关财务数据进行分析,从源头上防范和降低信贷风险。本文采用熵权法、数据统计分析法、K均值聚类和BP神经网络等机器学习算法来给出相应的信贷策略,规避信贷风险。实验基于2020年全国大学生数学建模竞赛赛题发布的公开数据集,利用MATLAB R2018a和Python 3.9等工具进行代码编写。测试结果表明,本文方法可以有效地对中小微企业的信贷风险进行评估并制定相应的信贷策略。 展开更多
关键词 风险评级模型 机器学习 熵权法 BP神经网络 K均值聚类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部