-
题名大型电力企业基于GBase分布式数据仓库建设初探
被引量:7
- 1
-
-
作者
邱菊
王岩
黄佩卓
王洋
-
机构
北京中电普华信息技术有限公司
-
出处
《计算机应用与软件》
北大核心
2018年第5期184-189,共6页
-
文摘
随着信息化时代高速发展,记录企业经营活动的业务数据得到大量积累,对融合各个业务系统中的信息和提供统一数据标准等方面提出新的挑战。在国家电网企业级数据仓库模型建设项目背景下,借鉴中国移动、中国建行等企业数据仓库或数据中心建设经验,结合统一数据中心的建设目标及功能需求,针对性设计数据仓库物理模型并对其建设进行初步探索。通过选取GBase 8a分布式数据库实现数据仓库模型的落地,国网全国各省市公司分析域于60天内完成36套核心业务系统数据抽取到明细层分系统模型的工作,并开展明细层营销域分域模型试点建设的探索。
-
关键词
数据仓库
物理模型
全业务
GBase
8a
分布式
-
Keywords
Data warehouse
Physical model
Full business
Gbase 8a
Distributed
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名电力非结构化大文本特征提取研究
- 2
-
-
作者
王家凯
黄佩卓
李勇乐
盛爽
刘洋
郑玲
魏振华
-
机构
国家电网有限公司大数据中心
华北电力大学
-
出处
《浙江电力》
2024年第6期117-124,共8页
-
基金
国家自然科学基金(62373150)
国家电网公司大数据中心科技专项资助项目(SGSJ0000YYJS2310054)。
-
文摘
电力大文本中存在大量专业词汇缩写和别名等不规则表达,现有分词工具无法有效识别电气工程领域专业词汇,这对非结构化文本的分析和利用造成很大影响。首先,根据电气工程领域非结构化文本特点,提出一种电气工程领域词汇索引规则,基于该索引规则构建的索引集进行分词能够有效改善分词效果,为电力文本特征提取提供基础。其次,利用有效的长文本分割算法保留原始文本语义信息,将基于BERT模型提取的文本特征信息与Word2Vec提取的电力词汇特征信息进行联合嵌入,从而提取到准确的电力非结构化大文本特征。最后,通过实验证明了所提出的电力非结构化大文本特征提取方法的有效性。
-
关键词
电力大文本
特征提取
BERT
文本分割
联合嵌入
-
Keywords
large power text
feature extraction
BERT
text segmentation
integrate and embed
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于电力数据中台的资产地图自动化构建技术研究
- 3
-
-
作者
盛爽
黄佩卓
刘洋
陈佳琦
-
机构
国家电网有限公司大数据中心
-
出处
《电气时代》
2022年第12期90-93,共4页
-
文摘
研究基于电力数据中台的资产地图自动化构建技术实现方法,通过该方法实现对不同用户提供一体化的应用数据入口,采用知识图谱结合元仓的方式为构建方案核心,结合AI算法能力,通过深度理解用户需求,从数据元仓和数据图谱中检索出相关内容结果返回给用户。电力企业数据中台建设现状电力数据具有以下三方面鲜明特点:一是覆盖范围广,包括发电运行数据。
-
关键词
电力数据
知识图谱
数据元
数据图
技术实现方法
中台
应用数据
深度理解
-
分类号
TM73
[电气工程—电力系统及自动化]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-