
中国商业联合会数据分析专业委员会组织的数据分析员(CDA)考试丛书,针对数据分析门者。包括: 《CDA数据分析考试大纲》 《CDA数据分析:零基础门》 《CDA数据分析实务》 中国商业联合会数据分析专业委员会是经国务院国有资产监督管理委员会审核同意、中华人民共和国民政部正式批准和登记的中国数据分析行业主管协会。协会推出的人才培养体系: CPDA数据分析师 CDA数据分析员 协会网址:http://www.chinacpda.org 培训网址:http://www.cdachina.com


本书是关于Access 2007的大全类书籍,囊括了Access 2007的所有功能,尤其是Access 2007的新增功能(例如改进的全新用户界面、功能强大的模板、增强的排序和筛选功能、表格式布局、导航窗格等)进行了详尽阐释。

1、凝结了作者10多年数据库营销从业经验,是纯实战经验的总结。 2、除总结了各种方法外,还提供了大量企业如何实施数据库营销的实例。 3、能够直提高董事长、总经理、企划人员、营销人员、客服人员的效率与业绩。

Hadoop 是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的 Hadoop ( CDH5 , ApacheHadoop 2.6 )版本介绍 Hadoop 技术的相关知识,不但详细介绍了 Hadoop 、 HDFS 、 YARN 、 MapReduce 、 Hive 、 Sqoop 和 HBase 等,还深探讨了 Hadoop 、 HBase 的运维和性能调优,并包含了一个具有代表性的完整的基于 Hadoop 的商业智能系统的设计和实现。 本书的大特是面向实践。基础篇介绍 Hadoop 及相关组件的同时,包含了大量动手实例,而应用篇包含的基于 Hadoop 的完整实例脱胎于生产环境的真实项目。在应用篇中,读者不仅能够通过项目实战巩固基础篇的学习效果,还能学习商业智能系统的发过程。 本书由浅至深,从理论基础到项目实战,适合 Hadoop 的初学者阅读,也可以作为高等院校相关课程的教学参考书。 本书主要内容 包含了 Hadoop 新版本的几

萧文龙、李逸婕、张雅茜编著的《Oracle11g数据库**入门教程》在讲述数据库原理的同时,详细介绍数据库的管理、表空间的管理、表的管理、数据的操作与管理、用户与权限的管理等。本书系统化介绍生产管理系统,包括基本需求说明、公司组织图、创建数据库表及关系说明、设置用户权限、添加表数据、开发程序代码、创建生产管理系统验证等。本书通过ASP和JSP程序访问Oracle 11g数据库、企业数据管理实战、Enterprise Manager实战。



数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考EMC Proven Professional数据科学家认证。EEMC专家认证是IT行业领先的教育和认证项目,涵盖了信息存储技术、虚拟化技术、云计算、数据科学与大数据分析等领域。通过认证是一种很好的自我投资方式,同时也是对自己专业知识的正式验证。本书可以作为准备数据科学专员(EMCDSA)认证的资料。在驱动企业和服务提供商转型

本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训学校相关专业的师生教学参考。

1. 强调实战2. 覆盖大数据行业主流技术岗位,紧跟市场与企业步伐3. 来自企业的骨灰级大咖授课4. 内容结构完整,根据循序渐的认识规律设计章节顺序

SQL Server从入门到精通(光盘内容另行下载,地址见书封底)

华为区块技术发团队编著。全新畅销升级版。全面介绍了区块技术的起源和演、关键技术原理、产业政策和发展概况、监管要求,分享剖析实际落地案例并示范应用实践过程,展望区块价值及未来发展趋势。本书附有精美电子课件。


Python语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用HDF5对大小从GB至TB的数字数据集行存档和共享的细节、实践以及陷阱,体验在Python语言中用HDF5存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主题。本书的例子对于Python2和Python3都适用。 本书包括以下内容:设置HDF5工具并创建HDF5文件。通过学习HDF5数据集对象来使用数据集。理解数据集分块和压缩等高级功能。使用组来学习如何利用HDF5层次性结构。使用HDF5的属性来添加元数

目前,数量众多的数据中心给企业、政府机关带来了非常沉重的运维负担。

1.本书作者均来自Spark的母公司Databricks。他们将带你始使用Spark,并了解如何利用它适应这个属于大数据和机器学习的新时代。 2.第2版在第1版的基础上做了大量更新,涵盖Spark 3.0的新特性,并着重展示如何利用机器学习算法执行大数据分析。 3.Spark项目创始人Matei Zaharia、Spark PMC成员Reynold Xin力荐。 毋庸置疑,数据已经成为现代化企业的重要资产,大数据分析技术则是企业挖掘数据价值的核心利器。一直以来,Spark就是大数据分析领域的佼佼者,也已经成为一站式大数据分析引擎的事实标准。 * 学习使用Python、Java、Scala的结构化数据API * 理解Spark SQL引擎的原理 * 掌握Spark应用的优化技巧 * 了解如何读写数据源:JSON、Parquet、CSV、Avro、ORC等 * 使用Structured Streaming分析批式数据和流式数据 * 使用Spark和Delta Lake构建湖仓一体的系统 * 使用MLlib发机器学习流水线


云数据库时代的技能升级 超复杂数据库环境案例精粹 走向自动化、智能化的数据服务 安全 连续 高效 智能的解决方案实践

MYSQL 5.5从零开始学(光盘内容另行下载,地址见书封底)
本书是面向MySQL数据库管理系统初学者的一本高质量的书籍。

信息和网络技术的高速发展使得大数据成为当前学术界和工业界的研究热,数据爆炸式的增长给人类社会带来了前所未有的机遇与挑战。一方面,基于大数据的处理、分析和共享等技术可以提高企业经济和社会效益。另一方面,隐私已经成为大数据应用领域亟待解决的重要问题。在大数据时代,如何做到获取和利用数据与个人隐私安全的平衡,已然成为当下亟需解决的一个时代命题。

2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录! 交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。 成功创下这项纪录背后,有ODPS很大的功劳! *集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、*、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。 ODPS(OpenDataProcessingService)是*自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场? 本书是学习和掌握ODPS的权威指南,作者来自阿里ODPS团队。 本书包括以下重

还在与bug、性能问题、程序崩溃、数据损坏以及令人费解的输出等问题死磕?如果你是一名数据库程序员或DBA,你将每天都要与这些问题交道。它们的应对之策是知道如何行迅速的恢复。本书采用独特的视角,通过大量案例来演示如何处理MySQL中遇到的棘手问题。 本书由Oracle的首席技术支持工程师编写,它提供了用于解决各种问题(从简单到复杂)的相关背景、工具和步骤。无论是你插的数据无法在查询中出现,还是因为服务器故障而导致整个数据库被损坏,只要本书在手,你都可以轻松应对这些问题。 即使问题很容易解决,也要理解问题产生的根源 当应用程序在多个线程上运行时,处理所发生的问题 调试和修复由配置选项引发的问题 探究操作系统调优如何影响服务器 使用特定的排错技术来重现问题 参考其他排错技术和工具,其中包括第三方解决方案 学习可实

Java微服务测试:基于Arquillian、Hoverfly、AssertJ、JUnit、Selenium与Mocki
微服务面临不可预知负载,分布式设计带来安全性能隐患,异步通信容器让挑战加剧。 内容涵盖自动化测试微服务系统集成测试以容器为中心的系统测试服务虚拟化 基于JVM微服务实现单元集成测试,实践高级混沌测试集成测试契约测试 ArquillianTomEE主创人员执笔,重磅企业场景测试实战力作首度问世 一切从用Java EEWildFly SwarmDocker来搭建微服务环境起步

全面系统地介绍了达梦数据库体系结构、数据库日常维护操作和数据库基本参数设置,是学习达梦数据库的基础教材和参考用书。

介绍数据科学基本知识的重量级读本,Google数据科学家作品。 数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为 21世纪头号性感职业 。本书从零始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识 数学和统计学。 作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。通过阅读本书,你可以:学到一堂Python速成课;学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;掌握如何收集、探索、清理、转换和操作数据;深理解机器学习的基础;运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;探索推荐系统、自然语言处

本书以Oracle数据库高阶技术为主,版本跨越9i10g11g,详细讲解了各种重要概念以及相关知识点,使得读者从新的层面和角度理解Oracle技术内涵,其中原理架构的讲解更侧重数据库管理和优化的内容,从系统层面看待架构的组成以及各类组件的作用。

从动态的角度描述成为一个数据产品经理需要的能力

(1)讲解企业数据架构、数据模型基础概念,以及经典数据建模方法论。 (2)全面介绍数据模型从设计到落地及管控等方面的细节。 (3)提供证券、保险、教育、航空业的数据架构及数据模型的案例和实践路径,为政企数字化转型提供参考。


zi深数据库工程师写给初学者的实用指南!107张图表 209段代码 88个法则,菜鸟阶bi备!基于标准SQL编写,明示各RDBMS(PostgreSQL/DB2/MySQL/Oracle/SQL Server)的差异!1.畅销书全新升级,内容更新更全面!第1版豆瓣评分8.8分,重印13次,好评如潮。第2版基于新版本RDBMS全面升级,并新增一章介绍从应用程序执行SQL语句的方法。2.由浅深,结构清晰,真正适合初学者!从数据库、表的结构到查询、更新表的语法,常用的函数,表的联结等,内容逐步深。对于初学者常见的疑难,均通过专栏行讲解。各章节后精心设计了练习题,帮助读者巩固理解。3.双色印刷,排版独特,让你读起来不累!双色印刷赏心悦目, 学习重 KEYWORD 备忘 法则 专栏 等各种小模块帮你梳理知识,让学习过程事半功倍。

本书内容严谨精细、生动活泼,从内容来看,共分为四大部分,共11章。

编写高效率的数值计算处理程序,可以大大提高科研水平。

1.本书提供Mooc等辅助教学资源,方便教学。2.每章*后小节给出一个完整项目实践案例,帮助读者系统理解数据库技术应用方法。解决传统教材理论知识与产业工程实践脱节、工程案例偏少的问题。3.本书第7章介绍了目前大量应用的NoSQL数据库技术及其应用方法,如键值对数据库、列存储数据库、文档数据库、图形数据库等技术知识。

Spark大数据商业实战三部曲:内核解密|商业案例|性能调优
基于*的Spark2.2.X版本,分为内核解密篇,商业案例篇,性能调优篇,共31章,学习过程中有任何疑问,可加QQ群,有专业人员答疑解惑。

MySQL主从原理是高可用架构的基石。 本书彻底地分析了MySQL主从原理。 本书是作者多年来研究MySQL原理和实践的成果。 MySQL从业人员应人手一本备在身边,以防不时之需。

《Oracle 12c数据库门与应用》的特色 书中采用大量的实例行讲解,力求通过实际操作使读者更容易地掌握Oracle数据库应用。 难度适中,内容由浅深,实用性强,覆盖面广,条理清晰。 知识全 紧紧围绕Oracle数据库展讲解,具有很强的逻辑性和系统性。 实例丰富 各章实例短小却又能体现出知识的精髓,让读者很轻松地学习,并能灵活地应用到实际项目中。 基于理论,注重实践 在讲述过程中,不仅仅只介绍理论知识,而且在合适位置安排综合应用实例或者小型应用程序,将理论应用到实践当中,来加强读者实际应用能力,巩固发基础和知识。

本书以数据库零基础的读者为对象,循序渐地讲解Oracle的各项管理技术及实战技能,用实例引导读者深学习。本书适合任何想学习Oracle数据库的人员,无论你是否从事计算机相关行业,是否触过Oracle,通过学习本书均可快速掌握Oracle的管理方法和技巧。本书配套下载包中,每一章内容都录制了相应的多媒体视频,极大地方便了读者快速、高效地学习和理解Oracle 12c数据库。

SAP 高性能分析应用软件(SAP High-Performance Analytic Appliance,SAP HANA)自2011年作为成熟的产品和解决方案向全球推广以来,引起了数据库领域非常强的一次震动。




Kafka*初是由LinkedIn公司发的消息系统,现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统,随着版本的不断迭代,在0.10.x版本之后Kafka已成为一个分布式流数据处理平台,特别是Kafka Streams的出现,使得Kafka对流数据处理变得更加简单。Kafka发展至今已具备很多特性,如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等,也正是由于Kafka具备这些特性,使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排,由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时,Kafka核心组件各成一节;讲解Kafka基本操作及应用实践时,从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系,读者可以从其中

1.本书以一个虚构的餐厅评应用程序为例,完整地展示了图应用程序的构建过程。 2.本书示例采用企业级应用程序的常用语言Gremlin,在不同图数据库产品之间具有较强的可迁移性。 3.完整清晰的学习结构,通过11章内容帮助读者从门到实践,再到阶学习图数据库: 门:掌握基本概念、图数据建模、图遍历。 实践:使用图数据库构建 友聚 应用程序。 阶:分析性能,避免陷阱和反模式。 戴夫和乔希是成绩斐然的图架构师和发人员,我想不出还有谁能更好地引导你踏上理解图数据库的旅程并帮助你规划路线。 Ted Wilmes,JanusGraph技术指导委员会委员 这本书深浅出地介绍了图应用程序的构建过程。无论是对数据建模还是对数据库技术感兴趣的朋友,均可以通过此书领略图数据库的魅力。 付晓岩,IBM副合伙人

数据可视化经典著作 讲解清晰、示例丰富、实用性强 创作信息图的**参考指南

本书以MySQL数据库的基础及维护为切入点,重点介绍了MySQL数据库应用系统的性能调优,以及高可用可扩展的架构设计。

推荐: 《 Spark 大数据处理技术》 ( SharkSpark SQLSpark StreamingGraphxTachyon 深度解密 Spark 完整生态 ** Committer 凝聚一流实力与超前视野 Spark 创始人及实践先驱联合推荐) 《 Hadoop 硬实战》 学习 Hadoop 和 Mapreduce 不二之选 85 个 Hadoop 高级技巧实战案例 《寻路大数据:海量数据与大规模分析》 ( Google 大数据专家力作超豪华译者 作序者微博 高德 UCloud 三大老总联合作序推荐真正梳理趋势与生态 方案与工具选型 应用场景与价值挖掘的独家内参) 《深理解 Oracle RAC 12c 》 本土Oracle数据库性能优化**大师泣血力作 集十数年实战修行与潜心钻研之大成 盖国强等国内数据库一线名家联合推荐 囊括数据库性能优化技术所有分支与脉络,讲解通俗,实例经典

SQL Server入门很简单(光盘内容另行下载,地址见书封底)(仅适用PC阅读)
超好用的SQL Server入门书,极速入门,效率100%!数据库畅销书作者执笔 浅显易懂,零门槛学习SQL Server数据库,真的很简单 娓娓道来,亲切自然,老鸟带领菜鸟,快速跨入SQL Server的大门 10小时高清教学视频、217个典型实例、2个综合项目案例,通过动手实践提高开发水平 超值光盘,含本书配套教学视频和实例源文件,赠送418个SQL Server实例源代码和12小时教学视频 推荐阅读 (请点击链接查看): 入门很简单丛书 (精品畅销丛书,有口皆碑,新手) 零点起飞学编程 (新手学编程好帮手,编程其实并不难) Web开发典藏大系 (涵盖众多Web开发的前言技术,由一线Web开发人员打造) “Linux典藏大系”(丛书畅销10万册,全面、详细、深入、实用,Linux爱好者经典) 《Oracle数据库管理从入门到精通》 (全面介绍Oracle数据库管理与维护

作为新一代的源流处理器,Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。- Flink的适用场景- 流处理架构相较于批处理架构的优势- Flink中的时间概念- Flink的检查机制- Flink的性能优势


从统计学观出发,以数理统计为基础,全面系统地介绍了机器学习的主要方法。 根据全新设计的学习路线图编写,注重夯实理论基础,更便于深化对知识的理解,建立系统性的全局观。 对机器学习所涉及的数学基础行了完整的解释和必要的铺垫,更便于读者对深化相关知识的理解。

《循序渐进Oracle:数据库管理、优化与备份恢复》从基础知识入手,详细讨论了Oracle数据库的创建、从OEM到GridControl、Oracle的字符集、用户的创建与管理、表空间和数据文件、自动存储管理(ASM)、临时表空间和临时文件、备份与恢复、备份方案与特例恢复、Oracle的闪回特性、Oracle的数据加载与卸载、从Statspack到ADDM、故障诊断及分析方法等热点问题,并通过大量取自实际工作现场的实例,力图将Oracle知识全面、系统、深入地展现给读者。

对于应用程序,无论是在私有云部署还是在公有云部署,本书都列出了丰富实用的解决方案和示例。 即使不具备 Docker 相关知识,基于书中实用的解决方案,发人员也能在阅读几章之后包和部署分布式应用程序。如果你是一位运维人员,你将很快掌握如何使用 Docker 来改善自己的工作方式。如果你是一位 IT 专业人士,你将能够学习到如何解决日常问题,比如创建、运行、共享和部署 Docker 镜像。 管理容器、挂载数据卷和容器连 创建和共享镜像 单主机或多主机的 Docker 网络 处理 Docker 配置与发等阶问题 使用 Kubernetes 在分布式集群中部署多容器的应用程序 使用为 Docker 优化的新一代操作系统 学习用于应用程序部署、持续集成、服务发现和编排的工具 在 Amazon AWS 、 Google GCE 和 Microsoft Azure 上使用 D

也许你未曾意识到,但你时常在与MySQL或其分支交道。作为高效且稳定的源数据库,MySQL备受各大电商网站和社会媒体网站青睐。若想快速并深了解如何使用和维护MySQL,本书便是绝佳参考。这本注重实践的学习指南以简单明了、条理清晰的方式,教你安装、使用和维护MySQL及其重要分支MariaDB。 本书作者既是MySQL与MariaDB专家,也是小说家。他以生动的语言和翔实的示例分析带你领略数据库设计和数据管理的方方面面。章末精心设计的习题将有助于你温故而知新。 创建和修改MySQL表,并在其中声明字段和列 通过示例,掌握数据的插、选取、更新、删除、连和子查询 使用字符串函数对列中的文本行查找、抽取、格式化和转换 学习用于数学或统计运算,以及日期和时间格式化的相关函数 执行管理任务,例如管理账号、备份数据库和批量导数据 使用PHP等各种编

本书是关于数据管理知识体系的专业指南,可以使从业者有效提升数据管理知识和技能,是DAMA国际推出的数据管理专业人士考试培训及备考的书籍。 在信息朝代,数据已经成为*重要的要素.数据管理对于提升企业对业绩、风险和市场响应的管理能力具有重要现实意义。


这是一个数据信息时代,每分每秒都在产生数不尽的数据。这些数据如何获取,有什么用途,如何与前沿的深度学习、机器学习等相结合,如何为我们所用,尽在本书中。 更多计算机好书请关注:电子工业出版社当当自营店


暂无

本书一方面对Flink的技术架构做了深的介绍,另一方面涵盖了Flink大多数API,本书每章都提供了一些实践案例和习题训练,帮助读者了解、上手和熟悉Flink技术。与其他中文Flink图书相比,本书从初学者角度出发,结合相关案例,深浅出,有助于读者学懂学会Flink。