题名 Beta回归模型在数据挖掘预测中的应用
被引量:36
1
作者
李泽安
葛建芳
章雅娟
机构
南通大学计算机科学与技术学院
出处
《南通大学学报(自然科学版)》
CAS
2009年第3期83-85,94,共4页
基金
南通大学自然科学基金项目(08Z032)
文摘
为避免利用常规的线性回归模型分析时出现的拟合值超出取值范围的情况,应用beta回归模型研究房地产销售数据.首先基于极大似然估计得到了房地产销售率的预测估计和区间估计,数值结果表明,该模型要比其他回归模型更科学、更合理.然后基于预测估计,提出了一些针对不同家庭收入群体的销售策略.
关键词
beta 回归模型
比例数据
预测
数据挖掘
Keywords
beta regression model
proportion data
forecast
data mining
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
题名 基于beta回归的长白落叶松树干含水率预测模型
2
作者
曹华燕
苗铮
郝元朔
董利虎
机构
东北林业大学林学院
出处
《应用生态学报》
CAS
CSCD
北大核心
2024年第3期587-596,共10页
基金
国家自然科学基金项目(31971649)
黑龙江省自然科学基金优秀青年项目(YQ2022C005)
+1 种基金
中央高校基本科研业务费专项资金项目(2572020DR03)
黑龙江头雁创新团队计划项目(森林资源高效培育技术研发团队)资助。
文摘
为探究人工长白落叶松边材、心材、树皮、树干含水率沿树干的纵向变化规律,本研究结合样地、样木效应,构建了基于beta回归的含水率混合效应模型,采用不限定相对高度(方案Ⅰ)和限定高度在2 m以下(方案Ⅱ)2种抽样方式对模型进行校正。结果表明:边材、树干含水率沿树干向上逐渐增加;心材含水率沿树干向上先略减后增大;树皮含水率沿树干向上先增大后趋于平缓,然后再增加。相对高度、活冠高、林分每公顷胸高断面积、年龄和林分优势高是显著影响长白落叶松木材含水率的因子。方案Ⅰ下,随机抽取2~3个圆盘的含水率测量值来校准模型可以得到稳定的预测精度,树干含水率的平均绝对误差百分比(MAPE)可达7.2%(随机抽取2个),边材、心材、树皮含水率的MAPE可达7.4%、10.5%、10.5%(随机抽取3个);方案Ⅱ下,抽取1.3和2 m圆盘的含水率测量值校准模型最适宜,边材、心材、树皮和树干含水率的MAPE分别达到7.8%、11.0%、10.4%和7.1%。所有beta混合效应回归模型的预测精度都明显优于基础模型。包含样地、样木效应的两水平beta混合效应回归模型可以很好地预测长白落叶松各部位的含水率。
关键词
长白落叶松
木材含水率
beta 回归模型
边材
心材
树皮
树干
Keywords
Larix olgensis
wood moisture content
beta regression model
sapwood
heartwood
bark
stem
分类号
S791.22
[农业科学—林木遗传育种]
题名 Beta回归模型基于EM算法的变量选择方法
3
作者
王玲
赵为华
机构
南通大学理学院
出处
《安徽师范大学学报(自然科学版)》
CAS
2019年第1期16-21,共6页
基金
国家社会科学基金会项目(15BTJ027)
国家自然科学基金项目(15171112)
文摘
本文针对响应变量取值为(0,1)区间上的比例数据研究Beta回归模型的贝叶斯变量选择方法。首先通过选取合适的先验分布,基于贝叶斯随机搜索和EM方法提出了参数的估计算法;然后根据回归系数相应的指示变量后验分布提出了重要变量选择的门限准则,所提方法具有易实施、快速计算等特点;最后通过研究中国上市公司股息率实际数据的影响因素以说明所提方法的有效性。
关键词
beta 回归模型
EM算法
贝叶斯变量选择
Keywords
beta regression model
EM algorithm
Bayesian variable selection
分类号
O212
[理学—概率论与数理统计]
题名 树木胸径和树高二元分布的建模与预测(英文)
被引量:8
4
作者
金星姬
李凤日
贾炜玮
张连军
机构
东北林业大学林学院
美国纽约州立大学环境科学和林业学院锡拉丘兹NY
出处
《林业科学》
EI
CAS
CSCD
北大核心
2013年第6期74-82,共9页
基金
Supported by the Scientific Research Funds for Forestry Public Welfare of China(201004026)
Ministry of Education “Overseas Experts and Scholars” project
文摘
采用二元广义β分布(GBD-2)和Johnson's SBB分布对美国东北部云冷杉林的水平和垂直分布进行拟合。拟合优度检验结果表明:无论是胸径、树高边缘分布和联合分布,还是树高和材积的预估,GBD-2分布的拟合效果均比SBB分布要好。使用常用的林分变量如林分密度、公顷断面积、林分平均胸径、平均树高、平均冠幅和冠长建立回归模型对GBD-2分布的参数进行估计,表明未来林分水平和垂直结构可以由这些变量进行预测。所建立的二元分布模型可以为研究树木胸径、树高的实际关系和动态提供信息。
关键词
二元广义β分布(GBD-2)
Johnson's
SBB分布
拟合优度
林分水平和垂直分布
回归模型
Keywords
bivariate generalized beta distribution (GBD-2)
Johnson's SnB
goodness-of-fit
stand horizontal andvertical structures
regression model
分类号
S757
[农业科学—森林经理学]
题名 基于β-二项分布的结构易损性分析
被引量:3
5
作者
刘骁骁
吴子燕
王其昂
机构
西北工业大学力学与土木建筑学院
出处
《计算力学学报》
CAS
CSCD
北大核心
2014年第6期755-762,共8页
基金
国家自然科学基金(51278420)
西北工业大学博士论文创新基金(Z2013057)资助项目
文摘
易损性曲线建立过程中受激励不确定性和结构参数不确定性的影响,会引起结构或构件观测结果的统计相关性。为此,本文提出基于β-二项分布的结构易损性分析方法。该方法根据性能量化指标阈值和Monte Carlo模拟确定震后观测结果,采用β-二项分布探讨震后观测值的统计相关性;结合对数回归模型,推导了改进β-二项分布的累积分布函数,计算结构失效概率;通过累积对数正态分布拟合易损性曲线,比较了观测失效样本数与观测失效概率统计相关性对易损性的影响,并与未考虑统计相关性的传统易损性曲线作对比。某8层钢筋混凝土框架-剪力墙结构的算例表明,考虑统计相关性的易损性较传统易损性偏大,且结构遭受8度以上地震作用时,考虑失效样本数统计相关性的易损性使预测结果更为保守,利于工程安全。
关键词
结构易损性
β-二项分布
对数回归模型
统计相关性
观测值
量化指标阈值
MONTE
Carlo
Keywords
structural fragility beta -binomial distribution logistic regression model statistical depend-ence observations indicators threshold Monte Carlo
分类号
TU311.2
[建筑科学—结构工程]
O212.1
[理学—概率论与数理统计]