-
题名机器学习化数据库系统研究综述
被引量:32
- 1
-
-
作者
孟小峰
马超红
杨晨
-
机构
中国人民大学信息学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2019年第9期1803-1820,共18页
-
基金
国家自然科学基金项目(61532016,61532010,91846204,91646203,61762082)
国家重点研发计划项目(2016YFB1000602,2016YFB1000603)~~
-
文摘
数据库系统经过近50年的发展,虽然已经普遍商用,但随着大数据时代的到来,数据库系统在2个方面面临挑战.首先数据量持续增大期望单个查询任务具有更快的处理速度;其次查询负载的快速变化及其多样性使得基于DBA经验的数据库配置和查询优化偏好不能实时地调整为最佳运行时状态.而数据库系统的性能优化进入瓶颈期,优化空间收窄,进一步优化只能依托新的硬件加速器来实现,传统的数据库系统不能够有效利用现代的硬件加速器;数据库系统具有成百个可调参数,面对工作负载频繁变化,大量繁琐的参数配置已经超出DBA的能力,这使得数据库系统面对快速而又多样性的变化缺乏实时响应能力.当下机器学习技术恰好同时符合这2个条件:应用现代加速器以及从众多参数调节经验中学习.机器学习化数据库系统将机器学习技术引入到数据库系统设计中.一方面将顺序扫描转化为计算模型,从而能够利用现代硬件加速平台;另一方面将DBA的经验转化为预测模型,从而使得数据库系统更加智能地动态适应工作负载的快速多样性变化.将对机器学习化数据库系统当前的研究工作进行总结与归纳,主要包括存储管理、查询优化的机器学习化研究以及自动化的数据库管理系统.在对已有技术分析的基础上,指出了机器学习化数据库系统的未来研究方向及可能面临的问题与挑战.
-
关键词
数据库系统
机器学习
学习化索引
自动化数据库系统
-
Keywords
database systems
machine learning
learned index
automatic database systems
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-