期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
数据挖掘中关联规则的提升及其应用 被引量:8
1
作者 朱建平 谢邦昌 《统计研究》 CSSCI 北大核心 2004年第12期34-39,共6页
The paper explores the problems of application of association rule of data mining.
关键词 关联规则 数据挖掘 提升
下载PDF
Logistic回归的ArctanLASSO惩罚似然估计及应用 被引量:5
2
作者 秦磊 谢邦昌 《数量经济技术经济研究》 CSSCI 北大核心 2015年第6期135-146,共12页
Logistic回归是计量经济学中应用最广的离散选择模型。当变量个数较多时,极大似然估计解释性较差,为此本文基于新的惩罚函数ArctanLASSO,给出Logistic回归的一种非凸惩罚似然估计进行参数估计和变量选取,并证明了估计量的n^(1/2)相合性... Logistic回归是计量经济学中应用最广的离散选择模型。当变量个数较多时,极大似然估计解释性较差,为此本文基于新的惩罚函数ArctanLASSO,给出Logistic回归的一种非凸惩罚似然估计进行参数估计和变量选取,并证明了估计量的n^(1/2)相合性和Oracle性质。本文结合二阶近似处理、LLA方法和梯度下降法给出估计算法,并通过最小化BIC准则对正则化参数进行选取。模拟数据分析显示,当样本量较大时,该方法在参数估计和变量选取两个方面都优于传统的LASSO、SCAD和MCP方法,样本量较小时,该方法同样具有很大优势。实际数据分析表明,该方法很好地权衡了拟合程度和非零系数的选择,是最优的备选模型,具有重要的实际意义。 展开更多
关键词 LOGISTIC回归 ArctanLASSO惩罚似然估计 n^1/2相合性 Oracle性质
原文传递
主成分聚类分析有效性的思考 被引量:46
3
作者 王德青 朱建平 谢邦昌 《统计研究》 CSSCI 北大核心 2012年第11期84-87,共4页
本文针对经典聚类分析和普通主成分聚类分析极端情形下的失效问题展开讨论,通过定义客观赋权的主成分距离为分类统计量,并以实证检验取得良好效果为依据,有效地解决了主成分聚类分析在极端情形下所不能揭示的问题。
关键词 分类 主成分聚类分析 极端情形
下载PDF
数据挖掘中的关联规则 被引量:21
4
作者 戴稳胜 匡宏波 谢邦昌 《统计研究》 CSSCI 北大核心 2002年第8期40-42,共3页
The paper describes the classification of relationship rule and its effects judging standards and the realization procedure through computers.The paper fully introduces to the relevant knowledge about relationship rule.
关键词 数据挖掘 关联规则 支持度 置信度 增益 统计
下载PDF
区域金融生态环境评价与实证 被引量:29
5
作者 金欣雪 谢邦昌 《统计与决策》 CSSCI 北大核心 2014年第15期160-162,共3页
首先依据金融生态环境理论的研究成果,建立了两岸金融生态环境的评价指标体系,从金融发展指标和综合环境指标两方面,分别进行动态分析和对比分析,最后运用灰色关联度法进行了总体分析,综合评价了两岸十个省市的总体金融生态环境。
关键词 金融生态 主成分分析 灰色关联度
下载PDF
数据挖掘与商业智能的现况及未来发展 被引量:15
6
作者 谢邦昌 李扬 《统计与信息论坛》 CSSCI 2008年第5期94-96,共3页
随着商业数据量的快速增加,能够帮助企业从数据中寻找决策支持的工具越来越受到重视。在统计学等多学科支撑下,数据挖掘与商业智能将发挥越来越重要的作用。
关键词 数据挖掘 商业智能 决策
下载PDF
如何选择度量金融风险的指标 被引量:5
7
作者 崔嵬 张尧庭 +1 位作者 朱世武 谢邦昌 《统计研究》 CSSCI 北大核心 2003年第6期52-55,56,共5页
张尧庭教授是我国著名的统计学家 ,多年来一直对本刊给予大力支持。现在张尧庭教授正在病榻上与病魔进行搏斗。为了表达我们对张教授的敬意 ,本刊特在第 6、7、8期连续刊出张教授与其他学者合作的三篇文章。
关键词 金融风险 VAR 连接函数 度量指标 风险管理 Delta常态法 蒙地卡罗模拟法
下载PDF
用于分类的随机森林和Bagging分类树比较 被引量:17
8
作者 马景义 谢邦昌 《统计与信息论坛》 CSSCI 2010年第10期18-22,共5页
借助试验数据,从两种理论分析角度解释随机森林算法优于Bagging分类树算法的原因。将两种算法表述在两种不同的框架下,消除了这两种算法分析中的一些模糊之处。尤其在第二种分析框架下,更能清楚的看出,之所以随机森林算法优于Bagging分... 借助试验数据,从两种理论分析角度解释随机森林算法优于Bagging分类树算法的原因。将两种算法表述在两种不同的框架下,消除了这两种算法分析中的一些模糊之处。尤其在第二种分析框架下,更能清楚的看出,之所以随机森林算法优于Bagging分类树算法,是因为随机森林算法对应更小的偏差。 展开更多
关键词 组合方法 随机森林 Bagging分类树
下载PDF
拟自适应分类随机森林算法 被引量:16
9
作者 马景义 吴喜之 谢邦昌 《数理统计与管理》 CSSCI 北大核心 2010年第5期805-811,共7页
本文给出了集成学习模型可以收敛的集成学习算法,拟自适应分类随机森林算法。拟自适应分类随机森林算法综合了Adaboost算法和随机森林算法的优势,实验数据分析表明,训练集较大时,拟自适应随机森林算法的效果会好于随机森林算法。另外,... 本文给出了集成学习模型可以收敛的集成学习算法,拟自适应分类随机森林算法。拟自适应分类随机森林算法综合了Adaboost算法和随机森林算法的优势,实验数据分析表明,训练集较大时,拟自适应随机森林算法的效果会好于随机森林算法。另外,拟自适应分类随机森林算法的收敛性确保它的推广误差可以通过训练集估计,所以,对于实际数据,拟自适应分类随机森林算法不需要把数据划分为训练集和测试集,从而,可以有效的利用数据信息。 展开更多
关键词 集成学习 拟自适应 随机森林
原文传递
中国城镇家庭消费不平等分布测度研究 被引量:16
10
作者 谢邦昌 么海亮 《商业经济与管理》 CSSCI 北大核心 2013年第1期79-86,共8页
文章基于中国跨省区城镇家庭调查数据,本文对我国城镇家庭消费与收入进行了不平等指数测度;采用适应性核密度估计与相对分布法模拟了两阶段城镇家庭消费的分布情况与变动趋势。研究结果表明,我国城镇家庭消费不平等与收入不平等的变化... 文章基于中国跨省区城镇家庭调查数据,本文对我国城镇家庭消费与收入进行了不平等指数测度;采用适应性核密度估计与相对分布法模拟了两阶段城镇家庭消费的分布情况与变动趋势。研究结果表明,我国城镇家庭消费不平等与收入不平等的变化趋势具有一致性,消费不平等程度高于收入不平等;随着我国经济的发展,我国城镇家庭消费的整体水平得到提高,中高消费水平家庭比重不断增加,其中高消费家庭的比例增加更为显著,消费不平等呈现逐渐增加的趋势。 展开更多
关键词 城镇家庭 消费不平等 适应性核密度估计 相对分布法
下载PDF
Logistic回归的双层变量选择研究 被引量:13
11
作者 王小燕 方匡南 谢邦昌 《统计研究》 CSSCI 北大核心 2014年第9期107-112,共6页
变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构进行筛选,实现... 变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构进行筛选,实现了组内和组间双层选择。该方法的优点是对各单个系数和组系数采取不同程度的惩罚,避免了过度惩罚大系数,从而提高了模型的估计和预测精度。求解的难点是惩罚似然函数不是严格凸出的,因此本文基于组坐标下降法求解模型,并建立了调整参数的选取准则。模拟分析表明,对比现有代表性方法 Sparse Group Lasso、Group Lasso及Lasso,adSGL法不仅提高了双层选择精度,而且降低了模型误差。最后,本文将adSGL法应用于信用卡信用评分研究,与logistic回归相比,其具有更高的分类精度和稳健性。 展开更多
关键词 变量选择 群组变量 惩罚似然 信用评分
下载PDF
一种随机森林的混合算法 被引量:12
12
作者 曹正凤 谢邦昌 纪宏 《统计与决策》 CSSCI 北大核心 2014年第4期7-9,共3页
随机森林(RF)是众多分类算法中精确度较高的算法,但其精确度还有提升的需求。文章通过分析C4.5算法和CART算法的计算过程,比较了两者的异同点,提出了一种新的混合随机森林算法,并使用公共的UCI数据集进行实证分析,实验数据表明该算法可... 随机森林(RF)是众多分类算法中精确度较高的算法,但其精确度还有提升的需求。文章通过分析C4.5算法和CART算法的计算过程,比较了两者的异同点,提出了一种新的混合随机森林算法,并使用公共的UCI数据集进行实证分析,实验数据表明该算法可以提高随机森林的精确度。从而,使随机森林算法的应用领域得到了扩大。 展开更多
关键词 随机森林 混合算法 精确度
下载PDF
使用随机森林算法实现优质股票的选择 被引量:10
13
作者 曹正凤 纪宏 谢邦昌 《首都经济贸易大学学报》 北大核心 2014年第2期21-27,共7页
文章通过比较分析价值策略和成长策略,提出了以价值成长投资策略(GARP)理念为基础的选股模型指标体系,选用了2012年1月至2013年2月间360多支股票的4406个样本数据,通过等频算法对数据进行离散化预处理后,使用随机森林算法实现了较高正... 文章通过比较分析价值策略和成长策略,提出了以价值成长投资策略(GARP)理念为基础的选股模型指标体系,选用了2012年1月至2013年2月间360多支股票的4406个样本数据,通过等频算法对数据进行离散化预处理后,使用随机森林算法实现了较高正确率的股票分类,投资者可以据此判断是否继续持有股票。通过分析优选后的股票在行业平均收益、最值方面的实际表现,验证了该量化选股模型性能优异。 展开更多
关键词 随机森林 股票选择 股票投资 价值成长投资策略
下载PDF
金融高频数据挖掘研究评述与展望 被引量:7
14
作者 朱建平 魏瑾 谢邦昌 《经济学动态》 CSSCI 北大核心 2011年第6期59-62,共4页
金融高频数据构成海量数据集,属于数据挖掘的研究范畴,然而在金融高频数据的研究中,数据挖掘技术尚未得到足够的重视。金融高频数据的研究目前主要集中于对波动率、交易间隔等特征的建模,最优抽样间隔的选择等应用领域,国内鲜有方法论... 金融高频数据构成海量数据集,属于数据挖掘的研究范畴,然而在金融高频数据的研究中,数据挖掘技术尚未得到足够的重视。金融高频数据的研究目前主要集中于对波动率、交易间隔等特征的建模,最优抽样间隔的选择等应用领域,国内鲜有方法论框架下直接将金融高频数据作为研究对象的理论讨论与分析,这不可避免导致对高频数据认识上的一些误区和不一致。为此,本文对国内外金融高频数据的研究现状进行了剖析,澄清了金融高频数据的概念与特征,并从统计的视角重新审视了金融高频数据研究。在此基础上,提出了金融高频数据挖掘进一步的研究思路。 展开更多
关键词 金融高频数据 数据挖掘 统计分析
原文传递
山东省消费者信心指数测度及其实证研究 被引量:6
15
作者 田金方 张小斐 谢邦昌 《山东经济》 2010年第3期148-152,共5页
为了全面反映城镇居民对当前经济生活的评价和对未来经济生活发生变化的预期,同时为了反映金融危机下消费者的基本消费情况、投资情况以及文化产业发展情况,结合山东省自身社会经济发展状况,本文编制了山东省17地市消费者信心指数,并对... 为了全面反映城镇居民对当前经济生活的评价和对未来经济生活发生变化的预期,同时为了反映金融危机下消费者的基本消费情况、投资情况以及文化产业发展情况,结合山东省自身社会经济发展状况,本文编制了山东省17地市消费者信心指数,并对调研结果进行了总体评价和交叉统计分析研究,给出了当前山东省城镇居民消费者的动静态信心模式。得出消费者不仅满意于目前的我省经济社会发展状况,而且对未来发展状况更是充满信心;但居民对物价有"后顾之忧"。 展开更多
关键词 消费者信心指数 金融指数 文化指数
下载PDF
数据挖掘技术在保险客户理赔分析中的应用 被引量:4
16
作者 陈希 李迪安 +2 位作者 高星 陈帅 谢邦昌 《统计与决策》 CSSCI 北大核心 2010年第4期154-158,共5页
利用数据挖掘技术对海量保险业务数据进行风险分析,通过交叉频数分析确定保单中风险较大的因素,为管理决策提供依据;将决策树、支持向量机、逻辑斯蒂回归和贝叶斯网络四种数据挖掘算法用于保户分类,提取高风险保户的潜在特征,挖掘理赔... 利用数据挖掘技术对海量保险业务数据进行风险分析,通过交叉频数分析确定保单中风险较大的因素,为管理决策提供依据;将决策树、支持向量机、逻辑斯蒂回归和贝叶斯网络四种数据挖掘算法用于保户分类,提取高风险保户的潜在特征,挖掘理赔概率较高的保户群,以指导保险公司的营销工作。 展开更多
关键词 数据挖掘 高风险保户 理赔分析
下载PDF
有序聚类虚拟变量法及其应用 被引量:4
17
作者 方匡南 朱建平 谢邦昌 《数理统计与管理》 CSSCI 北大核心 2012年第2期333-340,共8页
本文在对邹至庄检验和递归最小二乘法剖析基础上,综合有序聚类法和虚拟变量方法,提出了一种新的结构稳定性检验方法—有序聚类虚拟变量法,克服chow检验和递归最小二乘法等在系数稳定性检验中的缺陷,利用蒙特卡罗模拟方法比较了这三种方... 本文在对邹至庄检验和递归最小二乘法剖析基础上,综合有序聚类法和虚拟变量方法,提出了一种新的结构稳定性检验方法—有序聚类虚拟变量法,克服chow检验和递归最小二乘法等在系数稳定性检验中的缺陷,利用蒙特卡罗模拟方法比较了这三种方法的优劣。并利用这三种方法对从沪深300成份股中按πPS方法抽取出来的30只股票进行β系数稳定性检验比较。研究表明,有序聚类虚拟变量法在检验系数稳定性比邹至庄检验方法和递归最小二乘法更为有效。 展开更多
关键词 系数稳定性检验 有序聚类虚拟变量法 Β系数
原文传递
基于Bayes概率边界域的粗集分类方法及其在高频数据中的应用 被引量:2
18
作者 来升强 谢邦昌 朱建平 《统计研究》 CSSCI 北大核心 2010年第3期76-82,共7页
作为一种近似处理的工具,粗集主要用于不确定情况下的决策分析,并且不需要任何事先的数据假定。但当前的主流粗集分类方法仍然需要先经过离散化的步骤,这就损失了数值型变量提供的高质量信息。本文对隶属函数重新加以概率定义,并提出了... 作为一种近似处理的工具,粗集主要用于不确定情况下的决策分析,并且不需要任何事先的数据假定。但当前的主流粗集分类方法仍然需要先经过离散化的步骤,这就损失了数值型变量提供的高质量信息。本文对隶属函数重新加以概率定义,并提出了一种基于Bayes概率边界域的粗集分类技术,比较好地解决了当前粗集方法所面临的数值型属性分类的不适应、分类规则不完备等一系列问题。 展开更多
关键词 可变精度粗糙集 Bayes边界域 高频数据
下载PDF
金融危机前后中信行业指数联动效应及其社团结构比较 被引量:3
19
作者 谢邦昌 游涛 《商业经济与管理》 CSSCI 北大核心 2015年第1期80-87,共8页
文章采用平面最大过滤图和Info Map算法研究中信行业指数网络在金融危机前、中、后三个阶段的联动效应及其社团结构。研究结果表明,三个阶段的指数网络都存在小世界性质,且危机期间的网络联动效应最强;社团结构在危机期间有相互融合的... 文章采用平面最大过滤图和Info Map算法研究中信行业指数网络在金融危机前、中、后三个阶段的联动效应及其社团结构。研究结果表明,三个阶段的指数网络都存在小世界性质,且危机期间的网络联动效应最强;社团结构在危机期间有相互融合的整体趋势即网络变得更加紧密;社团中核心节点存在局部影响优势,某些边缘节点间存在局部强联动效应。 展开更多
关键词 中信行业指数 平面最大过滤图 社团结构 联动效应
下载PDF
数据挖掘在老龄人口健康调查中的应用 被引量:3
20
作者 朱建平 戴颖 谢邦昌 《统计与信息论坛》 CSSCI 2009年第10期74-78,共5页
研究高龄老人的问题,对实现健康老龄化具有重要的意义,也会填补关于高龄老人信息的空白。在入户调查数据的基础上,用聚类分析、神经网络、决策树、逻辑斯蒂回归等数据挖掘技术,对老人的思维状况、日常活动能力和户外活动等基本方面进行... 研究高龄老人的问题,对实现健康老龄化具有重要的意义,也会填补关于高龄老人信息的空白。在入户调查数据的基础上,用聚类分析、神经网络、决策树、逻辑斯蒂回归等数据挖掘技术,对老人的思维状况、日常活动能力和户外活动等基本方面进行数据建模分析。针对影响老龄人思维能力和身体健康的主要因素,应加快老年人服务机制和福利设施建设,创造老年人就业机会,开展老年人再教育。 展开更多
关键词 老龄化 数据挖掘 建模分析
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部