-
题名一种海量数据的分析技术——符号数据分析及应用
被引量:19
- 1
-
-
作者
胡艳
王惠文
-
机构
北京航空航天大学经济管理学院
-
出处
《北京航空航天大学学报(社会科学版)》
2004年第2期40-44,共5页
-
基金
国家自然科学基金资助项目(70041034)
-
文摘
传统的统计分析方法在处理海量数据方面存在很大的局限性。为了解决这一问题,符号数据分析(symbolicdataanalysis,SDA)方法被提出并得到了迅速的发展。SDA方法对传统的数据概念做了本质性的扩张,运用'数据打包'的理念,对海量的原始数据在不破坏其原有内在逻辑关系的前提下,可以进行变量和样本点空间的双重降维,并将传统的统计分析技术扩展到符号数据分析体系中。符号数据的方法体系是知识发现和数据管理领域的最新研究方向之一,目前在国内鲜有相关的研究资料。文章详细阐述了符号数据因素分析技术的原理和概念,并以中国股票市场为案例研究背景,结果表明,SDA因素分析技术对综合简化大规模多维数据系统是十分有效的。
-
关键词
符号数据分析(sda)
海量数据
数据打包
双重降维
股票市场
-
Keywords
symbolic data analysis (sda)
huge data
style indices
risk-return feature
stock market
-
分类号
C931.1
[经济管理—管理学]
-
-
题名基于区间型符号数据的群组推荐算法研究
被引量:7
- 2
-
-
作者
郭均鹏
宁静
史志奇
-
机构
天津大学管理与经济学部
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第1期67-71,共5页
-
基金
国家自然科学基金资助项目(70701026
71271147)
-
文摘
传统群组推荐算法基于点数据描述群组用户模型,存在着信息缺失、很难统筹考虑所有个体用户的需求等问题。针对该问题,对个体评分数据按照符号数据分析的思想进行"打包",将群组成员的评分信息汇总为区间型符号数据。在Hausdorff距离基础上,采用区间内部点数据的描述统计量,提出了一种全新的区间数距离度量方法,并利用这种距离对区间型符号数据描述的群组实施K-均值聚类,由此确定相似群组,最后通过最近邻的评分预测目标群组的评分。将这种全新的群组推荐算法与传统方法进行推荐精度与效率的对比实验,结果表明,在各种实验条件下,基于区间型符号数据的群组推荐算法均优于传统点数据的群组推荐算法。
-
关键词
群组推荐
符号数据分析
聚类分析
-
Keywords
group recommendation
symbolic data analysis(sda)
cluster analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP301.6
[自动化与计算机技术—计算机科学与技术]
-
-
题名区间数据典型相关分析技术及其在股市分析中的应用
被引量:2
- 3
-
-
作者
王立元
胡艳
王惠文
-
机构
北京航空航天大学经济管理学院
-
出处
《系统工程理论与实践》
EI
CSCD
北大核心
2005年第1期128-133,共6页
-
基金
国家自然科学基金(70041034)
国家杰出青年科学基金(70125003)
-
文摘
采用一种针对大规模复杂数据的分析技术——符号数据分析方法(SymbolicDataAnalysis简称SDA),以中信证券风格指数作为研究对象,对2002年中国股票市场的财务指标与市场表现进行典型相关分析.研究结果表明,中国股市财务状况与市场表现相关性明显,上市公司的收益状况、偿债能力、资金管理能力及价值/成长因素决定股票的运行状况,不同风格股票在财务-市场关系方面差异性显著,行业特征明显.通过分析可以看到,运用符号数据对中国股市运行特征进行的分析结论与客观现实非常吻合,从而证明使用符号数据的典型相关分析技术对大规模多维动态数据系统进行统计分析是十分有效的.
-
关键词
符号数据分析(sda)
典型相关分析
股票市场
风格指数
-
Keywords
symbolic data analysis(sda)
canonical correlation analysis
stock market
style indices
-
分类号
O21
[理学—概率论与数理统计]
-
-
题名改进的基于符号数据的协同过滤推荐算法
被引量:3
- 4
-
-
作者
郭均鹏
陈莹莹
-
机构
天津大学管理与经济学部
-
出处
《计算机应用》
CSCD
北大核心
2011年第11期3060-3062,3067,共4页
-
基金
国家自然科学基金资助项目(70701026)
-
文摘
随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量。奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路。提出一种改进的基于符号数据的协同过滤推荐算法,即将奇异值分解和符号数据分析方法结合起来运用到推荐系统中。在EachMovie数据库集上的实验结果表明该算法在数据稀疏时的推荐质量明显优于传统的推荐算法。
-
关键词
协同过滤
符号数据分析
奇异值分解
稀疏性
推荐系统
-
Keywords
collaborative filtering
symbolic data analysis(sda)
Singular Value Decomposition(SVD)
sparsity
recommendation system
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
TP391.3
[自动化与计算机技术—计算机科学与技术]
-
-
题名股票综合评价的符号数据PCA方法
被引量:2
- 5
-
-
作者
李汶华
郭均鹏
-
机构
天津大学管理学院
-
出处
《数理统计与管理》
CSSCI
北大核心
2009年第4期730-735,共6页
-
基金
国家自然科学基金青年基金资助项目(70701026)
-
文摘
符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。研究应用区间型符号数据的PCA方法来评价股票的市场综合表现问题。首先介绍了符号数据分析的基本理论。接下来研究了区间数据样本的经验描述统计量的计算,并基于经验相关矩阵,给出了区间主成分分析的算法,该算法最终得到区间数表达形式的主成分取值。最后选取上海证券交易市场20支股票在某一周上的交易数据,进行了实证研究,基于区间主成分得分的矩形图表示,将20支股票按其市场综合表现分成了四类。
-
关键词
符号数据分析
主成分分析
区间数
股票
-
Keywords
symbolic data analysis (sda), principal component analysis (PCA), interval number, stock
-
分类号
O212.4
[理学—概率论与数理统计]
F832.5
[理学—数学]
-
-
题名符号数据典型相关分析技术及其在股市分析中的应用
- 6
-
-
作者
王立元
-
机构
北京航空航天大学经济管理学院
-
出处
《系统工程》
CSCD
北大核心
2004年第8期91-95,共5页
-
基金
国家自然科学基金资助项目(70371007)
国家杰出青年科学基金资助项目(70125003)
-
文摘
采用一种针对大规模复杂数据的分析技术——符号数据分析方法(SymbolicDataAnalysis,SDA),以中信证券风格指数作为研究对象,对2002年中国股票市场的财务指标与市场表现进行典型相关分析。研究结果表明,中国股市财务状况与市场表现相关性明显,上市公司的收益状况、偿债能力、资金管理能力及价值/成长因素决定股票的运行状况,不同风格股票在财务-市场关系方面差异性显著,行业特征明显。通过分析可以看到,运用符号数据对中国股市运行特征进行的分析结论与客观现实非常吻合,从而证明使用符号数据的典型相关分析技术对大规模多维动态数据系统进行统计分析是十分有效的。
-
关键词
符号数据分析(sda)
典型相关分析
股票市场
风格指数
-
Keywords
symbolic data analysis(sda)
Canonical Correlation Analisis
Stock Market
Style Indices
-
分类号
F830
[经济管理—金融学]
-