
Python虽然是一门编程语言,但是在数据分析领域实现的功能和Excel的基本功能一样,而Excel又是大家比较熟悉、容易上手的软件,可以通过Excel数据分析去对比学习Python数据分析。本书将数据分析过程中涉及的每一个操作都对照讲解,让你从熟悉的Excel操作中去学习对应的Python实现,而不是直学习Python代码,大大降低了学习门槛,消除了大家对代码的恐惧心理。这也是本书的一大特色,让读者可以像学Excel数据分析一样,轻松学习Python数据分析。

无论是梦想颠覆某个行业的创业者,还是试图从企业内部激发变革的创新者,你面临的**挑战就是创造人们真正需要的产品。本书将引导你走上正确的道路。 精益丛书由精益思想创始人埃里克·莱斯为您呈现。该丛书旨在透过实际案例,为创业团队发人员、经理和其他成员介绍精益创业方法的精髓。在领悟这个方法的过程中,你会掌握各种工具,让你步步为营,迅速做出明智的决策。

只要学会数据思维,数据分析任你摆布 只要有想法肯动脑,有无基础皆可学会 只要懂得指标设计,项目落地信手捏来

1.DevOps传奇人物吉恩 金继《凤凰项目》后的又一力作,运维名著《凤凰项目:一个IT运维的传奇故事》的姊妹篇; 2.中国敏捷教练联盟秘书长肖然作序推荐; 3.DevOpsDays中国峰会核心组织者倾力翻译; 4.从软件发人员的角度继续讲述无极限零部件公司的故事。

重可平衡:数据中台为主讲解中台建设中的产经经理工作技巧,兼顾业务中台。 落地易操作:图解化理论,没有高高在上的说教,手把手教你如何操作。 以 案 促教:以阿里巴巴、58等中台应用较为成熟的公司为依托讲解。

大数据时代书系(一本书读懂大数据+一本书读懂互联网思维+一本书读懂互联网+一本书读懂互联网金融)套装共四册

本书一方面对Flink的技术架构做了深的介绍,另一方面涵盖了Flink大多数API,本书每章都提供了一些实践案例和习题训练,帮助读者了解、上手和熟悉Flink技术。与其他中文Flink图书相比,本书从初学者角度出发,结合相关案例,深浅出,有助于读者学懂学会Flink。

这是一个数据信息时代,每分每秒都在产生数不尽的数据。这些数据如何获取,有什么用途,如何与前沿的深度学习、机器学习等相结合,如何为我们所用,尽在本书中。 更多计算机好书请关注:电子工业出版社当当自营店

1.Presto是由Facebook源的高性能分布式SQL查询引擎,其用户包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。 2.作为高性能分布式SQL查询引擎,Presto能够针对不同的数据源高效、快速地执行交互式分析。大数据的兴起使得数据存储机制多样化。面对标准不一的存储系统,你可以利用Presto轻松破壁垒,连通数据孤岛。 3.本书由Presto项目创始成员参与执笔。你将学会用简单的Presto语句快速查询多个数据源,把握SQL-on-Anything的精髓。在任何规模、任何存储系统、任何环境中,你都能发挥SQL的威力。 - 门:探索Presto的用例,学习安装、配置和使用Presto。 - 阶:深理解Presto的架构,学习连器实例和SQL高级特性。 - 实践:了解如何在生产环境中使用Presto,保证安全性,与其他工具集成。

透彻讲解Excel、SQL、Tableau、Python四项数据分析必会工具,数据分析工作者的案头工具书。 系统介绍数据分析的策略、方法(数据分析之道);实例讲解引导、快速掌握数据分析工具(数据分析之术);免费提供书中涉及的全部数据集文件、数据库源文件、程序代码(1GB)。 非常实用的数据分析学习用书。

本书并不仅讲述如何使用Excel软件,而且从任务出发,阐述如何根据任务需求来拆解问题,形成图表制作的思路,并运用工具完美呈现任务,达到数据分析的目标。 本书特色: 1 以数据为中心,针对不同类型的数据,分别阐述多样化的可视化方法。读者可从中了解不同呈现方式的优劣和适用场景,在遇到实际任务时,能做出恰当的选择 2 采用商业、金融领域有代表性的真实数据案例,详细介绍不同图表的制作方法和技巧。 3 配套讲解视频和Excel案例资源

在大数据和人工智能的浪潮下,企业对数据分析师的需求与日俱增,要求也越来越高。本书犹如一本行动指南,将数据分析师面试与工作内容紧密结合,理论与实战兼顾。从数据到算法、从业务到创新,帮助读者造一专多能的数据分析技能树,对想要从事数据分析工作的人员而言是一份不可多得的资料。

金融行业已经以惊人的速度采用Python,一些大的投资银行和对冲基金使用Python来构建核心的交易和风险管理系统。本书可以帮助发人员和量化分析人员门Python,并指导他们掌握Python在计量金融学上的重要应用。 本书通过大量的实用示例并以一个大型的真实案例研究为基础,讲解如何为基于蒙特卡洛模拟的衍生品和风险分析发一个成熟的框架。本书大部分内容使用了交互式的IPython Notebooks,并包含了如下主题。 基础知识:Python数据结构,NumPy数组处理、用pandas行时间序列分析,用matplotlib可视化,用PyTables行高性能I/O操作,日期/时间信息处理和精选的实践。 金融主题:使用了NumPy、SciPy和SymPy的数学技术,例如回归和优化;用于蒙特卡洛模拟、风险价值、风险信用价值计算的推断统计学;用于正态性检验、均方差投资组合优化、主成分分析(PCA)和贝

Spark发者出品! 《Spark快速大数据分析》是一本为Spark初学者准备的书,它没有过多深实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark的用法,它对Spark的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。 本书介绍了源集群计算系统Apache Spark,它可以加速数据分析的实现和运行。利用Spark,你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。 本书由Spark发者编写,可以让数据科学家和工程师即刻上手。你能学到如何使用简短的代码实现复杂的并行作业,还能了解从简单的批处理作业到流处理以及机器学习等应用。

1 作者为中科院软件所博士,其多年发表论文的经验使得这本书的行文完全会让你眼前一亮,严谨且准确。 2 作者精心绘制200余幅图,本书用四色印刷尽力真实还原出来,呈现着作者强大的技术工匠精神。 3 本书采用问题驱动的叙述方式,强调基本原理的阐述,内容非常扎实,且更多的是关乎大数据处理框架的底层原理描述,所以一旦学懂,肯定会让你在大数据领域更上一层楼。

缺少数据资源无以谈未来,缺少数据资源无以言发展。大数据无处不在。今天,掌握大数据已经成为提升企业竞争优势的必要条件。得数据者得天下,知己知彼才能为企业和个人的发展提供关键制胜点。拨云见日,把高深的大数据原理简单说,让每个人都能读懂大数据,会用大数据。从什么是大数据到大数据在当今生活工作的作用以及如何使用大数据来帮助自己更简便的获取有效信息本书都有详细说明。

《量化投资:交易模型发与数据挖掘》是一本适应当前投资市场的量化投资门书。本书不仅仅是详细说明了什么是量化投资,更是从原理、技术和实操角度教会读者如何来使用、操控这门技术,让读者知道量化,更能用好量化来为自己的投资增加机会。

以Python语言为基础,配合原理、方法、案例行讲解 专注预测专题,体系化介绍预测技术工程实施的技能 深度剖析预测原理,细致解读数据分析算法


沃趣团队凭借着多年的运维经验,为行业客户提供专业数据库、系统相关的服务和产品。《千金良方 MySQL性能优化金字塔法则》是其核心团队的呕心力作,全书细致地介绍MySQL的基本原理,以及性能优化的实际案例。 无论你是MySQL初学者,还是专门从事MySQL工作的发人员和运维人员,或者是资深的MySQL DBA,都值得一读!

大数据:挖掘数据背后的真相(学会数据分析,立破谎言,新时代大数据分析入门书,无须数学、统计学基础,轻松掌握!)
透过纷繁的数据,找到*有用的信息,读这一本书就够。 没有学科门槛,不擅长数学、不懂统计学的人也能读得懂。

本书是浙江大学陈为教授、阿里巴巴资深技术专家、视物致知网站创始人沈则潜博士等专家历时多年造的一本全面、经典的数据可视化力著。 全书近千页的内容涵盖了数据可视化的基本理论、*的研究成果、大量的实践案例,指导你一路从小白修炼成专家。 本书选国家十三五重图书出版规划项目。 本书制作精美,全彩印刷,让读者充分领略纸版书的知识之美!

1.作者建设了国内高校首个大数据课程教师培训交流基地,造了中国高校大数据教学知名品牌,已经在国内高校形成了广泛的影响力。2.作者建设了国内高校首个大数据课程公共服务平台,为教师教学和学生学习大数据课程提供讲义PPT、学习指南、备课指南、上机习题、实验指南、技术资料、授课视频等,资源丰富。

数据可视化经典著作 讲解清晰、示例丰富、实用性强 创作信息图的**参考指南

Python语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用HDF5对大小从GB至TB的数字数据集行存档和共享的细节、实践以及陷阱,体验在Python语言中用HDF5存储科学数据。通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主题。本书的例子对于Python2和Python3都适用。 本书包括以下内容:设置HDF5工具并创建HDF5文件。通过学习HDF5数据集对象来使用数据集。理解数据集分块和压缩等高级功能。使用组来学习如何利用HDF5层次性结构。使用HDF5的属性来添加元数



SAP 高性能分析应用软件(SAP High-Performance Analytic Appliance,SAP HANA)自2011年作为成熟的产品和解决方案向全球推广以来,引起了数据库领域非常强的一次震动。

介绍数据科学基本知识的重量级读本,Google数据科学家作品。 数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为 21世纪头号性感职业 。本书从零始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识 数学和统计学。 作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。通过阅读本书,你可以:学到一堂Python速成课;学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;掌握如何收集、探索、清理、转换和操作数据;深理解机器学习的基础;运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;探索推荐系统、自然语言处


2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录! 交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。 成功创下这项纪录背后,有ODPS很大的功劳! *集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、*、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。 ODPS(OpenDataProcessingService)是*自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场? 本书是学习和掌握ODPS的权威指南,作者来自阿里ODPS团队。 本书包括以下重


介绍了当前*热门的基于浏览器的数据可视化库D3,它可以把数据加载到网页中并给予数据生产各种图表。要看懂这本书,之前有没有编程经验不太重要。也许你写过程序,也听说过JavaScript语言的各种传闻,那你可以从D3和数据可视化入手,,跟JavaScript**次亲密接触。

面对庞杂的大数据,可视化提供了良好的解读角度与方法,是大数据分析与应用的利器。 本书全面、细致地梳理了可视化的历史,理论,工具与应用案例,旁征博引,图文并茂,内容翔实丰富,专业严谨,是了解可视化知识的不二之选,也特别值得相关从业人员作为案头参考书备存。 本书选十二五国家重图书出版规划项目“大数据丛书”,并获得该领域著名学术带头人之一马匡六教授,石教英教授的专序推荐。 本书同时配备了在线资料提供与更新服务,读者可以随时与作者互动,深探讨。

这本书不要求读者的编程基础和数学知识,以尽量通俗易懂的语言来解释晦涩的数据挖掘算法原理,本书所保留的数学公式都是*基本的、不得不保留的公式,这将本书的阅读门槛降到了**。学习本书,读者将掌握*实用的数据挖掘算法,并能够立刻应用它们。

本书用轻松话语讲述一线数据分析技术,既有统计方法与分析技巧,更有奇闻趣事和哲学感悟,为你的数据分析之路指点迷津。


精通实时大数据分析! Druid项目主要创始人杨仿今、蚂蚁金服CTO鲁肃、饿了么CTO张雪峰、Testin云测总裁徐琨、 Druid中国用户组发起人陈冠诚、 TalkingData CTO肖文峰、 OneAPM创始人,董事长何晓阳、Cloudera大中华区技术总监刘隶放、神策数据公司创始人 CEO桑文锋、AdMaster(精硕科技)技术副总裁卢亿雷、微软中国研发中心,高级研发总监 Sherman Tong、AdHoc吆喝科技创始人CEO 王晔联合力荐!

特别推荐: 自己动手写 CPU( 含 CD 光盘 1 张 ) Java 特种兵(上册)(含 CD 光盘 1 张) 搜酷 : 全球智能硬件与技术精华集 ( 全彩 ) 三分虚拟技术,七分分布式管理,十二分大数据,深大数据系统设计、环境安装、发实践,助你快速投实战,直具备大数据系统研发能力。 推荐: 大数据:技术与应用实践指南 推荐阅读: 创新设计:如何造赢得用户的产品、服务与商业模式 互联网创业密码(互联网创业真人真事深度访谈实录:唱吧、胡莱和百思不得姐、春雨医生、视频达人秀、醋溜科技、爱记账、布丁、恺英、3W 咖啡、塔防三国志和贝瓦。) 同作者作品: 软件需求十步走——新一代软件需求工程实践指南(国内真正讲清软件需求的著作!切实解决软件需求的不完整、不准确等难问题,有助发能用、好用、耐用的软件产品) 推荐:管理海量

关于数据中心运维管理的书籍很多,但本书不落俗套,令人耳目一新之处在于: 资深的主创团队本书支持单位和主创团队绝大多数参与过《数据中心场地基础设施运维管理标准》的编写; 业内罕见的揭秘深度本书由国内运维经营们联袂创作,其中不仅有成功经验,还有对挫折和教训的反思,甚至还有惊心动魄的数据中心火灾过程。 新颖的内容布局本书的两大部分, 运维人手记 和 关键设备运维指南 ,既有内容丰富有趣的小说,还有专业的运维知识介绍。


中国商业联合会数据分析专业委员会组织的数据分析员(CDA)考试丛书,针对数据分析门者。包括: 《CDA数据分析考试大纲》 《CDA数据分析:零基础门》 《CDA数据分析实务》 中国商业联合会数据分析专业委员会是经国务院国有资产监督管理委员会审核同意、中华人民共和国民政部正式批准和登记的中国数据分析行业主管协会。协会推出的人才培养体系: CPDA数据分析师 CDA数据分析员 协会网址:http://www.chinacpda.org 培训网址:http://www.cdachina.com

大数据作为人工智能的基石,当前正站在计算机技术发展的风口, 而作为Apache*项目的HBase的优势是高性能读写、弹性伸缩、面向列族存储,能够轻松应对数据存储的爆发,提供对千万级QPS低延时需求支持,毫无疑问是企业搭建大数据在线实时应用的*。Hadoop生态系统的HDFS和MapReduce分别为大数据提供了存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精炼的语言介绍HBase基础知识,让初学者能够快速上手使用HBase,对HBase 的核心架构思想(如数据读取、数据备份等)有深的了解,并且剖析HBase源码,介绍HBase 1.X 以及2.0带来的新特性,让有经验的HBase发人员也能够循序渐地深理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,同时不

Hadoop 是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的 Hadoop ( CDH5 , ApacheHadoop 2.6 )版本介绍 Hadoop 技术的相关知识,不但详细介绍了 Hadoop 、 HDFS 、 YARN 、 MapReduce 、 Hive 、 Sqoop 和 HBase 等,还深探讨了 Hadoop 、 HBase 的运维和性能调优,并包含了一个具有代表性的完整的基于 Hadoop 的商业智能系统的设计和实现。 本书的大特是面向实践。基础篇介绍 Hadoop 及相关组件的同时,包含了大量动手实例,而应用篇包含的基于 Hadoop 的完整实例脱胎于生产环境的真实项目。在应用篇中,读者不仅能够通过项目实战巩固基础篇的学习效果,还能学习商业智能系统的发过程。 本书由浅至深,从理论基础到项目实战,适合 Hadoop 的初学者阅读,也可以作为高等院校相关课程的教学参考书。 本书主要内容 包含了 Hadoop 新版本的几



信息和网络技术的高速发展使得大数据成为当前学术界和工业界的研究热,数据爆炸式的增长给人类社会带来了前所未有的机遇与挑战。一方面,基于大数据的处理、分析和共享等技术可以提高企业经济和社会效益。另一方面,隐私已经成为大数据应用领域亟待解决的重要问题。在大数据时代,如何做到获取和利用数据与个人隐私安全的平衡,已然成为当下亟需解决的一个时代命题。

分析和总结了工业大数据应用过程中的做法和经验,为实践提供指导。

实用的Python源模块的大集合;简单易懂、示例丰富的数据分析教程;掌握数据可视化、机器学习等高端主题;新手变身数据分析专家的上好读本;


《*、天猫电商数据分析与挖掘实战(第2版)》第1版获得了很多读者的认可,甚至有不少高校将其改编成了教程,但《*、天猫电商数据分析与挖掘实战(第2版)》依旧有许多不足之处,比如对于运营模块内容较少而且不够深,特别是数据挖掘套件的安装和部署难倒了许多读者。 《*、天猫电商数据分析与挖掘实战(第2版)》第2版为了跟上时代的变化和解决软件部署烦琐的问题,首先将线下的数据平台改成新平台,或是用其他平台替代;其次是对于软件方面的升级,将 SQL Server 的挖掘套件换成了SmartMining 个人版,部分章节使用了 Excel 2016 版本,用 Power Pivot 实现数据建模,用PowerQuery 提升数据清洗的能力。

数学菜鸟也能搞懂数据分析! 从零学起:没有深奥的理论和晦涩的知识 实际体验:免费软件RStudio 提供模拟数据 应用R语言轻松学统计: 平均值/直方图/t检验/卡方检验/相关/回归分析/逻辑回归分析/文本挖掘 商家的抽奖促销有猫腻? 面包店的面包缺金少两? 调查问卷的结果该怎么分析? 曾经的热销商品为什么不好卖了? 网络上的匿名中伤者找得出来吗? 坏事的发生是否能预测? 让数据告诉你答案!

本书围绕股票挖掘,所构建的知识体系非常全面完善。在技术上,不仅包含了数据挖掘中常见的方法,如匹配方法、关联分析、分类、聚类、预测、时间序列分析等,还包括自然语言处理方法、深度学习方法、舆情分析方法、行为金融学心理学等方法。在数据应用上,不仅包含了对场内每笔成交数据的分析,还包括财务数据、新闻数据、股吧论坛、机构研报、用户行为等方面的分析。




本书帮你从看流量到看懂流量,从看数据到看懂数据,从了解访客的浏览行为到理解用户的搜索请求。


1.权威内容尝鲜。早鸟5G趋势类图书,侧重趋势而非技术,腾讯内部数据支撑,经得起推敲。 2.流量*的作者。腾讯安全战略研究中心官方出品。作者翟尤为得到讲师、知乎live 5G同名课程讲师,人次过2万。谢呼为腾讯副总裁 3.权威人士推荐。工程院院士邬贺铨推荐 4.权威会议推荐。世界5G大会推荐图书 5.权威数据支撑。大融合领域、40个实际案例、51条重知识、55次深度分析、121个关键定义、162组新数据
