Greenplum:从大数据战略到实现在线阅读
会员

Greenplum:从大数据战略到实现

冯雷
开会员,本书免费读 >

计算机网络数据库21.5万字

更新时间:2019-10-10 18:57:45 最新章节:术语表

立即阅读
加书架
下载
听书

书籍简介

本书分为四个部分。第一部分介绍大数据战略。其中,第1章将分享作者对于ABC(人工智能、大数据和云计算)之间关系的理解以及对人和人工智能的思考。第2章将介绍进取型企业为什么需要大数据战略以及如何建立大数据战略。第二部分介绍大数据平台。其中,第3章将以数据平台演进历史和未来趋势为主题,描述三次整合的背景及影响,介绍选择大数据平台需要考虑的因素,以及为什么Greenplum是理想的大数据平台。第4章为Greenplum数据库快速入门指南。第5章将介绍Greenplum架构的主要特点和核心引擎。第6章将介绍数据加载、数据联邦和数据虚拟化。第7章将介绍Greenplum的资源管理以及对混合负载的支持。第三部分介绍机器学习与数据分析。其中,第8章介绍Greenplum的各种过程化编程语言(用户自定义函数),用户可以使用Python、R、Java等语言实现用户自定义函数,还可以通过容器化技术实现自定义函数的安全性和隔离性。第9章将介绍Greenplum内建的机器学习库MADlib,数据科学家可以使用内建的50多种机器学习算法基于SQL对数据进行高级分析,并介绍如何扩展MADlib以实现新算法。第10章和第11章将分别介绍Greenplum如何对文本数据和时空数据(GIS)进行存储、计算和分析。第12章将介绍Greenplum丰富的图计算能力。第四部分介绍运维管理和数据迁移。其中,第13章将介绍各种监控和管理工具及相关企业级产品。第14章介绍数据库备份、恢复和迁移。第15章和第16章将分别介绍如何从Oracle和Teradata迁移到Greenplum。
品牌:机械工业出版社
上架时间:2019-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

冯雷
主页

最新上架

  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。
    姜文哲计算机19.6万字
  • 会员
    达梦数据库是一款非常优秀的国产数据库。本书从实用角度,通过对达梦数据库的体系结构、运行机制的讲解,以及与其他数据库相似功能的对比,帮助读者掌握达梦数据库的基本操作。本书第1章讲解达梦数据库的安装部署;第2章讲述达梦数据库的体系结构,并与Oracle的体系结构进行对比;第3章讲解数据库中最重要的两部分redo和undo;第4章介绍用户管理,重点讲述用户创建和权限;第5章讲解表和索引,并对普通表和堆表
    付强编著计算机10.7万字
  • 会员
    MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8
    张文亮编著计算机9.7万字
  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证
    (美)普拉桑特·苏特卡尔计算机11.7万字
  • 全书以学生成绩管理数据库案例为主线,从建立空数据库开始,逐步讲解数据库中的表、查询、窗体、报表、宏、模块、VBA程序设计与数据库编程等Access2016的主要功能;以图书馆借还书管理数据库项目实训为辅线,结合每章知识设计项目实训内容,帮助读者巩固和加深对所学知识的理解和掌握;以商品销售管理数据库实战演练为扩展训练,帮助读者提高应用数据库技术分析和处理数据的操作技能。本书符合最新版《全国计算机等
    谢萍 周蓉 苏林萍编著计算机13.8万字
  • 会员
    本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书
    闭应洲 许桂秋 刘军主编计算机14万字
  • 会员
    这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
    陈鹤 杨国栋计算机14万字

同类书籍最近更新

  • 会员
    Thisbookisdesignedforbusinessanalysts,BIanalysts,datascientists,orjuniorleveldataanalystswhoarereadytomoveonfromaconceptualunderstandingofadvancedanalyticsandbecomeanex
    Ashish Kumar Joseph Babcock数据库14.9万字
  • 会员
    这是一本讲解组织数据能力建设与数据应用工程化的著作,它旨在为企业应用和管理数据提供组织建设、技术体系和行业解决方案方面的理论指导和实践经验。本书是几位作者在数据领域十几年工作经验的总结,得到了业界10余位专家的一致好评。无论是互联网行业的数据原生类企业,还是正在数字化转型的传统企业,本书将为它们大规模、工程化地发挥数据的价值提供有意的参考。本书的内容大致分为如下4个方面:(1)行业分析:从宏观角度
    钟大伟 高铎 王鹏 宋超数据库29万字
  • 会员
    本书共分为三篇:一篇介绍数据库基础知识,重点是关系数据库理论;第二篇关注实践,重点是数据库服务器端的维护和管理;第三篇讨论数据库应用结构、数据访问接口以及应用领域和发展方向。附录用一个完整的示例说明了数据库设计的全过程。本书选用SQLServer2012作为数据库实践平台。本书注重理论与应用的结合,内容全面,实例丰富,并配有电子教案。本书可作为高等院校非计算机专业的数据库教材,也可作为计算机专
    张千帆数据库11.8万字
  • 会员
    本书是武汉工程大学王海晖、刘宝忠主编的《大学计算机基础》配套的实验指导教材。本书主要包括两个部分,第一部分为实验,内容包含6个实验,主要包括:计算机基本操作实验、Windows7操作系统实验、Office2010办公软件实验、网络基础实验、Photoshop图像处理实验、视频制作和处理实验;第二部分则包含了与主教材各章内容对应的全部习题。
    吴静 谢芳主编数据库13万字
  • 会员
    本书以大型数据库管理系统SQLServer2012为平台,通过一个贯穿全书的实例“天意购物”数据库,详细讲解了SQLServer2012的安装和配置,数据库的创建与管理,表、视图、索引、T-SQL语言、存储过程和触发器,数据库的备份恢复与导入导出,SQLServer的安全管理等内容。本书共分为绪论和6个项目,内容包括数据库基础知识、“天意购物”数据库设计与实现、“天意购物”数据库中数据表的创建与管
    刘玥数据库5.1万字
  • 会员
    本书详细介绍ProxmoxVE。ProxmoxVE是一个完整的企业虚拟化开源平台,具有去中心化的超融合特性。ProxmoxVE与前端负载均衡整合,可实现关键应用的高可用性。全书共15章,大致可分为几个部分:第1章和第2章为概述部分,主要介绍ProxmoxVE的基本特性及功能;第3~6章为基础部分,总览ProxmoxVE部署、简单管理等操作;第7~10章为项目实战,也是本书的精华部分,介绍
    田逸数据库8.6万字