
面对工作,你是否经常遇到以下问题:有一堆繁杂数据,怎么利用?软件很熟练,怎么跟需求结合?结论太简单,领导不满意,怎么深?分析完数据,如何得结论、提建议?找到新工作,如何快速掌握该行业的知识?阅读本书,给你答案!

1. 作者是注册会计师,熟练使用PowerBI,实践经验丰富。 2. 作者的公众号现已成为国内*影响力的PowerBI公众号之一,专注于PowerBI知识的分享,其文章通俗易懂、简洁干练、精彩不断,深受广大PowerBI学习者喜爱。

数据分析专家、 前Google人力分析团队经理撰写盖茨基金会、摩根大通银行等组织高管鼎力推荐秋叶PPT创始人、知识大本营创始人秋叶作序推荐《增长黑客》作者、圣骑咨询创始人范冰作序推荐

1.全书侧重实用性,涵盖从数据的采集、可视化到数据的持久化等各个方面的内容,帮助读者提升自主解决挑战性问题的能力; 2.本书包括如何设置组件、基础的Demo演示、系统集成、高级用例,以及报警和监控等主题,旨在帮助读者了解当今流行的实时处理工具,如Apache Spark、Apache Flink和Storm; 3.本书结合实际用例展示上述技术的具体应用,真正将理论运用到实践中,解决实际问题; 4.通过阅读本书,读者可以掌握实时数据处理和分析的相关知识,并能了解如何以*恰当的方式在生产环境中部署解决方案。

Microsoft Power BI数据建模与可视化快速上手
本书由浅深、详细地介绍了基于Microsoft Power BI的数据可视化与建模技术,并结合实际案例详细阐述其在数据可视化与建模方面的具体应用。全书以案例为主线,既包括软件应用与操作的方法和技巧,又融了案例实战,使读者通过对本书的学习,能够轻松快速地掌握数据可视化与建模方法。本书配套资源中包含案例采用的数据源文件,供读者在阅读本书时行操作练习。 本书可以作为管理、经济、社会人文等人员学习大数据建模与可视化技术的参考图书,也可作为高校计算机相关专业本科生、研究生的教材或教学参考书。

读者对象 本书适合想从事数据库程序员行业或即将参加数据库程序员面试求职的读者阅读,也可作为计算机相关专业毕业生的求职指导用书。 ★★精心甄选IT名企面试笔试、岗位测评、选拔晋升中涉及的经典编程题目(98%真题和真题演绎)。 ★★精准涵盖编程基础、核心技术、框架涉及、数据结构及算法等编程核心主题(100%解析透彻)。 ★★精心解析各类面试笔试中的高频考及难(100%场景模拟)。 ★★超值赠送职业规划库、软件技术库、面试资源库、求职资源库、本书全部源代码、编程水平测试系统、软件学习工具及电子书资源库。 读者对象 ★★准备从事数据库程序员工作的人员。 ★★准备参加数据库程序员求职面试的人员。 ★★正在学习软件发等计算机相关专业的毕业生。 ★★准备从事软件发行业的计算机爱好者。

本书基于Tableau 2020.1编写,结合编者十余年数据分析行业从业经验,详细介绍了该版本的数据连功能、图形编辑与展示功能,包括软件的安装与激活、数据类型和运算符、连数据源、基础操作、数据与图形的导出、连大数据、基础图表、函数、高级数据操作、地图分析、故事、Tableau Online、Tableau Server等内容。可以帮助读者快速掌握软件使用并应用于工作实践。

本书通过数据建模概念和zui佳建模实践为商业及IT 专业人员的实际工作提供指导。全书采用会话风格行编写,从而激励读者从头到尾地阅读本书,并实现以下10 个目标。1. 理解在什么情况下需要数据模型,以及各种情形下zui适当的数据模型类型是什么。2. 像阅读一本小说那样,轻松自如地理解任何规模和复杂度的模型。3. 具备创建完整的规范化关系数据模型和维度模型的能力。4. 具备将逻辑模型转换为高效物理模型的能力。5. 具备使用模板工具,高效获取应用需求的能力。6. 具备解释数据模型记分卡中10个计分项的能力。7. 获得如何与其他人员建立良好工作关系的实践经验。8. 了解非结构化数据及其模型化。9. 了解UML的基本概念。10. 具备在XML环境中创建数据模型的能力,并了解元数据和敏捷关的基本概念。

市场中**本Hive图书。 Hive在Hadoop系统中的应用趋势比较可观。

从统计学观出发,以数理统计为基础,全面系统地介绍了机器学习的主要方法。 根据全新设计的学习路线图编写,注重夯实理论基础,更便于深化对知识的理解,建立系统性的全局观。 对机器学习所涉及的数学基础行了完整的解释和必要的铺垫,更便于读者对深化相关知识的理解。

认识和学习知识图谱技术的敲门砖 这里有知识图谱技术的相关概念和发展趋势及挑战解析 这里有知识图谱技术在多个行业的实际应用和案例分析 中国信通院专家倾情撰写和推荐

本书第 1版出版以后,获得的业界反响超乎了我们的想象。实际上,本书已经广泛被互联网公司采用,作为商业化相关部门的培训教程,甚至还成了某大公司商业化部门年会时的 阳光普照奖 奖品。 经过一段时间的补充与修订,我们向读者奉上这次的新版,希望本书能帮助读者深了解互联网流量与数据变现,洞察互联网增长与财富的秘密,搭建商业化与获客的产品技术体系。 对以下读者,我们相信本书值得一读: ● 互联网公司的商业化、大数据和用户增长部门的朋友; ● 传统广告与数字广告从业者; ● 对推荐、大数据、人工智能技术的应用有兴趣者; ● 转型中的传统企业和创业公司的战略决策者; ● 计算机相关专业学生。 在新版中,我们特别注重了从人工智能方法论的视角审视整个计算广告体系。通过本书对计算广告领域抽丝剥茧的解读,读者会认识到,

本书作者从事计算机、电子、自动化、数字媒体技术等专业的教学工作多年,较清楚不同层次学生的需求;本书针对每个知识,结合案例行说明,程序均在VC 6.0环境下调试通过。

暂无

MySQL主从原理是高可用架构的基石。 本书彻底地分析了MySQL主从原理。 本书是作者多年来研究MySQL原理和实践的成果。 MySQL从业人员应人手一本备在身边,以防不时之需。

网上关于MySQL的资料比比皆是,但大部分都是针对单一具体问题的解答,例如如何配置MySQL双主复制等,全面系统讲述MySQL高可用这方面的资料并不多见。而且,这些资料大多只给出简单的实现方法,缺少相应的理论背景知识和分析验证过程。这是我写这本书的第二个原因,希望能填补缺口,让读者不但知其然,也知其所以然。 从2000年至今的20年里,我一直从事各种数据库相关的应用发和管理工作,尤其是近年来一直跟MySQL数据库交道。从*简单的单实例,到各种复制,再到集群以及与中间件的配合,在其使用上积累了一些经验和心得。这是我写这本书的第三个原因,希望将它们加以归纳和总结,汇集成书与读者分享。

数据科学领域元老级学者倾力造,SAP全球副总裁推荐畅销九个国家和地区,被20余所大学作为教科书数据科学商业应用的门指南,现代企业科学经营手册不同于其他讲述数据科学的书,本书从非数据科学人员,也就是管理者、投资者甚至工程师等人员的角度,阐述了数据科学这一新兴行业的基本原理和基础理念,而这正是本书的惊艳之处。在现代社会中,数据即商业,它是提升生产力、促创新和获取用户洞见的基础,数据思维和分析方法可谓是新时代的商战孙子兵法,只有善用数据者才能在这个数据驱动的环境中获得竞争优势。本书通过大量真实的商业问题案例,介绍数据科学的基本原理和各种数据挖掘技术,阐释如何从数据中提取出有用信息,而用数据科学方法解决商业问题,做出精准的决策。


作为新一代的源流处理器,Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。- Flink的适用场景- 流处理架构相较于批处理架构的优势- Flink中的时间概念- Flink的检查机制- Flink的性能优势

MongoDB数据库技术的掌握:包括基本的文档模型概念和数据操作,以及集群高可用、数据分片方面的知识。 ? MongoDB整合微服务的技能:需要对微服务周边的技术框架有一定的掌握。本书以当前*流行的 Java 微服务技术栈为背景,介绍了从MongoDB Java Driver、Spring Data Mongo(ODM层)到上层应用整合的各种实战范例。 ? MongoDB高阶技巧的掌握:包括MongoDB系统性能调优及MongoDB 架构高可用、安全性、高效运维管理方面的一些知识和经验。

Kafka*初是由LinkedIn公司发的消息系统,现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统,随着版本的不断迭代,在0.10.x版本之后Kafka已成为一个分布式流数据处理平台,特别是Kafka Streams的出现,使得Kafka对流数据处理变得更加简单。Kafka发展至今已具备很多特性,如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等,也正是由于Kafka具备这些特性,使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排,由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时,Kafka核心组件各成一节;讲解Kafka基本操作及应用实践时,从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系,读者可以从其中

1.从实践角度介绍如何将网站可靠性工程的实践应用于数据库架构和运维,为想成为数据库可靠性工程师的专业人士提供一个指导框架,发人员、系统管理员和初中级数据库管理员等都能从中受益。 2.首先介绍数据库可靠性工程师需要掌握的核心运维概念,然后介绍各种数据库持久性选项,包括如何利用关键技术提供有弹性、可扩展、高性能的数据存储和检索。有了数据库可靠性工程的坚实基础,读者便能深研究任何现代数据库的架构和运维。 -服务等级要求和风险管理 -构建并演具有运维可见性的架构 -基础设施工程和基础设施管理 -如何推动发布管理流程 -数据存储、索引和复制 -明确数据存储的特性和用例 -数据存储架构组件和数据驱动的架构

本书基于Stata 15.0版本,精选52个专业范例和3个综合案例,以实验教程的形式讲解应用Stata工具解决各种统计分析问题;针对每一个实验范例,都遵循从 原理、目的与要求、内容及数据来源、操作指导 几个方面行讲解,达到理论与实践相结合,掌握统计学和计量学的方法和模型的应用。 本书每章附有习题,方便读者在实践练习的过程中快速提高应用水平。 本书配套制作了可供下载的多媒体教学视频,方便读者参照本书行 虚拟课堂 的学习。

图形数据库经典产品Neo4j的核心人员力作。 世界上的大部分领域实际上都可以建模成图,而软件发人员或是数据库管理人员却在辛辛苦苦地将这些图转化成关系型数据库中的表。想象一下,假如你再也不用去做这样的转化,假如数据库的迁移可以变得轻松简单,你愿意去受一个全新的数据库吗?图数据库就是这样一个完全不同于关系型数据库的新型数据库,它处理的是大规模的数据和不断变化的需求,并且拥抱它们。 《图数据库》系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neon4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,*后还介绍了图数据库的工作原理以及一些实用的图论算法。 《图数据库》的三位作者均为图数据库经典产品Neo4j的

本书的显著特色是各部分功能基本都结合案例行讲解,可帮助读者快速掌握利用Microsoft Power BI行商业数据分析的专业方法与实战技能。

《深浅出数据科学》的目的是帮助你掌握数学、编程和商业分析的综合技能。通过本书,你将能够自信地提出并解答复杂的数据问题,从抽象和原始的统计信息发掘并完善可执行的想法。通过将数学和计算机编程技能相结合,你将踏上成为数据科学家的激动人心的旅程。本书介绍了数据科学的全过程,包括数据准备、数据清洗,以及如何选择有效的数据挖掘策略和技巧,从而深理解数据科学的方方面面。你将学到数学和统计学的核心知识,以及数据科学家和分析师经常使用的代码。你将了解机器学习,学会用常见的统计学模型分析稠密数据集,创建有说服力的可视化图表,并和他人交流分析结果。从本书你将学习到: 理解数据科学的五个核心步骤 聪明地使用你的数据,仔细地处理它 填平数学和计算机编程之间的鸿沟 学会概率论、微积分,以及使用统计模型处理数

对于金融科技的从业者,这是一个全新的时代。从B/S到SOA再到中台架构,标志着IT建设到了深水区,一方面IT系统不再是简单的信息保存,而是业务数据化,利用数据驱动业务;另一方面IT系统不再是简单的从业务需求转化为系统实现,而是需要通过可复用能力支撑甚至引导业务需求。本书通过七个部分,论述了金融企业中台的背景、目标、原则与分工、业务中台/数据中台/技术中台的实施方法、成熟度评估原则,这也是作者从SOA架构到中台架构、从平台化到中台化里程碑的总结。

1.本书提供Mooc等辅助教学资源,方便教学。2.每章*后小节给出一个完整项目实践案例,帮助读者系统理解数据库技术应用方法。解决传统教材理论知识与产业工程实践脱节、工程案例偏少的问题。3.本书第7章介绍了目前大量应用的NoSQL数据库技术及其应用方法,如键值对数据库、列存储数据库、文档数据库、图形数据库等技术知识。



1. 强调实战2. 覆盖大数据行业主流技术岗位,紧跟市场与企业步伐3. 来自企业的骨灰级大咖授课4. 内容结构完整,根据循序渐的认识规律设计章节顺序

众多公司花费了大量的时间和金钱获取数据,并将大量的数据保存在一个叫做数据湖的数据容器中。但是,其中又能有多少公司把数据从数据湖中取回并加以利用呢?事实上,很少有公司能把数据湖当成信息的金矿来使用。多数公司zui终得到的仅仅是一个垃圾场。本书将会告诉你如何去构建一个有用的数据湖,从而让数据科学家与数据分析师能够面对业务挑战并发现新的商机。通过阅读本书,你将能够学习如何:?构建数据湖并模拟数据;?应用数据及基于文本的数据池,从而将业务价值zuida化;?理解原始数据池的角色定位;?掌握使用归档数据池的时机;?利用4大核心组件:元数据、业务的整合对应,语境及元过程信息。本书的作者曾经让我们放眼于数据仓库的架构与成效,如今他又将我们带到数据湖架构的新高度。

本书适合作为高等院校相关专业的实用统计分析实验教材,也适合相关专业本科生、研究生以及从事统计分析和决策等领域的读者学习参考。

本书*版出版以后,已经被互联网公司广泛采用,作为商业化相关部门的培训教程。新版更注重从人工智能方法论的视角审视整个计算广告体系。通过本书对计算广告领域抽丝剥茧的解读,读者会认识到,除解决传统的感知和认知问题以外,人工智能领域形成的方法体系在广告这样的海量数据驱动且人类自身能力不强的问题上,有着巨大的施展空间。 希望本书能帮助读者深了解互联网流量与数据变现,洞察互联网增长与财富的秘密,搭建商业化与获客的产品技术体系。 用计算的力量改变世界是每一个程序员的梦想,而本书的主题正是用计算将数据和流量变成财富。这样的后向变现使得许多对用户有价值但直利润微薄的信息产品,在互联网时代找到了爆发式成长的机会。从这个角度来看,我们希望本书能够成为一本启示录,帮助每一个互联网人真正理解后向变现对于


机器学习的应用是高度自度化且自动修正的。学习到的数据越多,机器学习应用需要的人工干预越少。为了解决现实世界中复杂的数据问题,科学家们发出专门的机器学习算法来解决这些问题。数据科学正是通过算法和统计分析来帮助读者从现有数据中获取新知识的。 本书将解决如何高效地行数据分类及预测的问题。本书主要讲解7种数据科学算法,有k*近邻算法、朴素贝叶斯算法、决策树、随机森林,k-means聚类、回归分析和时间序列分析。 此外,你还会掌握如何对数据行预聚类,以便针对大型数据集行优化和分类。*后,你将了解如何根据数据集中的现有趋势来预测数据。本书的各章还有配套的练习题,以帮助你夯实内容,扩展相关知识。读完本书后,你将了解如何选择机器学习算法行聚类、分类或回归,并知道选择哪种算法来解决实际问题。 本书主要包括以下

本书是一本广受好评的Cassandra图书。

本书注重理论结合实践,既介绍大数据驱动的智能车间技术体系框架,深介绍每项技术解决的问题,又介绍各项技术的具体应用场景与企业实际案例,突出前沿大数据技术在智能车间中的实用价值。


本书基于Neo4j数据库3.5版本及其对应的ALGO和APOC扩展包,详细介绍了近二百个主要过程和函数的定义、相关理论、使用方法、代码样例,让广大Neo4j图数据库的设计和发人员能够快速掌握正确和高效的图数据库分析方法及其应用发技能。

编写高效率的数值计算处理程序,可以大大提高科研水平。


《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例

全面系统地介绍了达梦数据库体系结构、数据库日常维护操作和数据库基本参数设置,是学习达梦数据库的基础教材和参考用书。


暂无

本书从MySQL DBA新手的视角出发,详解MySQL 8数据库管理系统,引导初学者在较短的时间内掌握MySQL数据库管理技术。

《数据分析与量化投资 基于SAS的应用》基于SAS EG平台,采用项目管理的过程流方式,介绍数据分析及量化投资策略,让不熟悉编程的读者可以利用类似于SPSS的功能去完成统计分析,还可以调用本书中提供的宏语法快速行分析。

(1)本书以基本概念与实例相结合的方法,由浅深、循序渐地对大数据思维、技术和应用做了全面系统的介绍。(2)本书在每一个环节都配有与理论学习内容相结合的案例介绍,还有使用Java和Python语言编写的应用实例,使读者能够在大数据平台上通过实践亲身体验大数据处理和分析的过程,从而加快和加深对大数据理论和技术的理解。(3)为了使读者方便检验和复习巩固学习到的知识,本书每章后面都配有丰富的作业供学生完成。

(1)本书是国家精品课程“计算机基础”系列课程“数据库原理与技术”的主教材,也是国家精品资源共享课配套教材。 (2)采用Access 2013版本为操作平台介绍。 (3)理论与实践相结合,还安排有综合实例介绍,实用性强。

本书以Hadoop和Spark框架为线索,重介绍了Hadoop技术、Spark技术、大数据存储、大数据访问、大数据采集、大数据管理、大数据分析、大数据发、大数据环境自动化部署等内容,使读者对大数据技术有个比较全面的了解。

DB2数据库是IBM公司关系型数据库核心产品,在国内以及全球有着广泛的应用。


本书包含了2009年研究生学统考大纲的全部内容。本书讨论的典型数据结构问题。对于线性表、堆栈、队列、串、数组、广义表、树、二叉树和图等基本数据结构问题,都详细讨论了各自的逻辑结构、存储结构以及各种算法的设计方法。排序和查找是两个应用广泛的算法设计问题,本书讨论了几种典型的排序算法,讨论了静态查找、动态查找和哈希查找的存储结构和查找方法。广义表、树、二又树和图这些非线性结构的算法经常要设计成递归算法,本书专设一章讨论递归算法的设计方法等问题。

本书基于EViews 10.0版本,精选68个专业范例,以实验教程的形式讲解应用EViews工具解决各种统计分析问题,针对每一个实验,都遵循从 原理、目的与要求、内容及数据来源、操作指导 几个方面行讲解,达到理论与实践相结合,掌握统计学和计量学的方法和模型的应用。 章后精选27个上机练习题,动手实践,一步巩固所学的知识,提高动手操作能力和数据分析能力。 本书覆盖90%以上的统计模型,可作为即查即用的EViews使用手册。

Hadoop领域中**本操作手册大全。 对各层级的Hadoop使用者都有借鉴意义。


1.本书的编写团队写作经验丰富,有来自北京邮电大学的教授从事大数据工作的从业者; 2.本书内容深浅出,技术结合丰富的场景故事,通俗易懂,概念新颖,思想创新; 3.本书结合新颖案例帮助相关的技术人员或大数据的初学者了解大数据的相关知识。

