【电力大数据】浅谈电力行业元数据管理
01元数据管理背景元数据(metadata),又称中介数据或者中继数据,是“描述数据的数据(data about data)”。在《DAMA数据管理知识体系指南》中指出:元数据与数据的关系就像数据与自然界的关系,数据反映了真实世界的交易、事件、对象和关系,而元数据则反映了数据的交易、事件、对象和关系等。简而言之,任何可以用来描述特定数据的要素都可被视为元数据。对企业而言,元数据描述了数据(如数据....

《大数据管理概论》一3.4 大数据处理与存储一体化技术
本节书摘来自华章出版社《大数据管理概论》一书中的第3章,第3.4节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 3.4 大数据处理与存储一体化技术 日益增长的数据量对当前计算机系统提出了重大挑战。传统计算机系统依赖于计算为中心的计算和存储分离的计算模型。互联网的广泛应用、业务流的日趋复杂和数据获取方式的增多催生了大数据时代的到来,随后以“MapReduce”为核心思想的各....
《大数据管理概论》一3.3 基于新型存储的大数据管理
本节书摘来自华章出版社《大数据管理概论》一书中的第3章,第3.3节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 3.3 基于新型存储的大数据管理 闪存、PCM等新型存储的物理特性、读写特性等均与磁盘有着显著的不同,而目前已有的大数据数据库,其设计理念均是基于磁盘存储,在面对闪存、PCM等新型存储时并不能最大限度发挥新型存储的性能。目前,在基于新型存储的大数据管理方面也有一....
《大数据管理概论》一3.2 大数据存储与管理方法
本节书摘来自华章出版社《大数据管理概论》一书中的第3章,第3.2节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 3.2 大数据存储与管理方法 闪存、PCM等新型存储介质的引入使得大数据存储架构有了多种选择。但由于新型存储介质在价格、寿命等方面与传统的磁盘相比不具优势,因此目前主流的观点是在大数据存储系统中同时使用新型存储介质和传统存储介质,由此产生了多种基于新型存储的大数....
《大数据管理概论》一第3章‖大数据存储3.1 引言
本节书摘来自华章出版社《大数据管理概论》一书中的第3章,第3.1节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 第3章‖ 大数据存储 3.1 引言 大数据存储与管理研究首先面临的是存储技术上的挑战。虽然目前有许多存储技术有望用于大数据存储,但它们都存在局限性[36]。例如:目前以NoSQL数据库为代表的大规模分布式数据库系统设计了基于磁盘存储的读写方式、索引结构、查询执行....
《大数据管理概论》一2.6 大数据融合的驱动枢纽
本节书摘来自华章出版社《大数据管理概论》一书中的第2章,第2.6节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.6 大数据融合的驱动枢纽 数据融合与知识融合是一个相互启发、相互协调、逐步融合的过程,两者之间需要一个纽带进行衔接,我们把这个衔接纽带叫做智能晶格。此外,数据融合与知识融合还受一些共同因素的影响,如动态演化性、海量性和高速性,这些因素直接影响融合技术。 2.....
《大数据管理概论》一2.3 大数据融合的方法论
本节书摘来自华章出版社《大数据管理概论》一书中的第2章,第2.3节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.3 大数据融合的方法论 由2.2节的分析可知,大数据融合是一个多学科跨领域的研究问题,它的任务是将碎片化的数据相联系,将分散的数据集中,形成表层知识,即知识资源;进而使隐性知识显性化,使表层知识上升为普适机理。从而在数据资源、知识资源与用户之间建立有效的联系....
《大数据管理概论》一2.2 大数据融合的概念
本节书摘来自华章出版社《大数据管理概论》一书中的第2章,第2.2节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.2 大数据融合的概念 众所周知,大数据价值链是一个阶梯式循环过程:“离散数据→集成化数据→知识理解→普适机理凝练→解释客观现象、回归自然”,每一个链条是对大数据的一次价值提升。为了实现这一价值,我们提出了大数据融合的概念,它是获取高品质知识、最大程度发挥大数....
《大数据管理概论》一第2章‖大数据融合2.1 引言
本节书摘来自华章出版社《大数据管理概论》一书中的第2章,第2.1节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 第2章‖ 大数据融合 2.1 引言 大数据时代人们面临的最根本挑战是从数据中凝练可领悟的知识[10,11],其关键技术是数据的集成或融合[12]。进入21世纪以来,这些技术已经取得了重大进展,如深网(Deep Web)数据集成技术[13]、知识库(Knowled....
《大数据管理概论》一1.5 大数据管理的关键技术
本节书摘来自华章出版社《大数据管理概论》一书中的第1章,第1.5节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.5 大数据管理的关键技术 综上所述,大数据时代的数据存在如下几个特点:多源异构、分布广泛、动态增长、先有数据后有模式。正是这些与传统数据管理迥然不同的特点,使得大数据时代的数据管理面临着新的挑战,下面会对其中的主要挑战进行详细分析。 1.5.1 大数据融合 ....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。