
1.全书侧重实用性,涵盖从数据的采集、可视化到数据的持久化等各个方面的内容,帮助读者提升自主解决挑战性问题的能力; 2.本书包括如何设置组件、基础的Demo演示、系统集成、高级用例,以及报警和监控等主题,旨在帮助读者了解当今流行的实时处理工具,如Apache Spark、Apache Flink和Storm; 3.本书结合实际用例展示上述技术的具体应用,真正将理论运用到实践中,解决实际问题; 4.通过阅读本书,读者可以掌握实时数据处理和分析的相关知识,并能了解如何以*恰当的方式在生产环境中部署解决方案。

读者对象 本书适合想从事数据库程序员行业或即将参加数据库程序员面试求职的读者阅读,也可作为计算机相关专业毕业生的求职指导用书。 ★★精心甄选IT名企面试笔试、岗位测评、选拔晋升中涉及的经典编程题目(98%真题和真题演绎)。 ★★精准涵盖编程基础、核心技术、框架涉及、数据结构及算法等编程核心主题(100%解析透彻)。 ★★精心解析各类面试笔试中的高频考及难(100%场景模拟)。 ★★超值赠送职业规划库、软件技术库、面试资源库、求职资源库、本书全部源代码、编程水平测试系统、软件学习工具及电子书资源库。 读者对象 ★★准备从事数据库程序员工作的人员。 ★★准备参加数据库程序员求职面试的人员。 ★★正在学习软件发等计算机相关专业的毕业生。 ★★准备从事软件发行业的计算机爱好者。

本书基于Tableau 2020.1编写,结合编者十余年数据分析行业从业经验,详细介绍了该版本的数据连功能、图形编辑与展示功能,包括软件的安装与激活、数据类型和运算符、连数据源、基础操作、数据与图形的导出、连大数据、基础图表、函数、高级数据操作、地图分析、故事、Tableau Online、Tableau Server等内容。可以帮助读者快速掌握软件使用并应用于工作实践。

从统计学观出发,以数理统计为基础,全面系统地介绍了机器学习的主要方法。 根据全新设计的学习路线图编写,注重夯实理论基础,更便于深化对知识的理解,建立系统性的全局观。 对机器学习所涉及的数学基础行了完整的解释和必要的铺垫,更便于读者对深化相关知识的理解。

本书第 1版出版以后,获得的业界反响超乎了我们的想象。实际上,本书已经广泛被互联网公司采用,作为商业化相关部门的培训教程,甚至还成了某大公司商业化部门年会时的 阳光普照奖 奖品。 经过一段时间的补充与修订,我们向读者奉上这次的新版,希望本书能帮助读者深了解互联网流量与数据变现,洞察互联网增长与财富的秘密,搭建商业化与获客的产品技术体系。 对以下读者,我们相信本书值得一读: ● 互联网公司的商业化、大数据和用户增长部门的朋友; ● 传统广告与数字广告从业者; ● 对推荐、大数据、人工智能技术的应用有兴趣者; ● 转型中的传统企业和创业公司的战略决策者; ● 计算机相关专业学生。 在新版中,我们特别注重了从人工智能方法论的视角审视整个计算广告体系。通过本书对计算广告领域抽丝剥茧的解读,读者会认识到,

暂无

MySQL主从原理是高可用架构的基石。 本书彻底地分析了MySQL主从原理。 本书是作者多年来研究MySQL原理和实践的成果。 MySQL从业人员应人手一本备在身边,以防不时之需。

网上关于MySQL的资料比比皆是,但大部分都是针对单一具体问题的解答,例如如何配置MySQL双主复制等,全面系统讲述MySQL高可用这方面的资料并不多见。而且,这些资料大多只给出简单的实现方法,缺少相应的理论背景知识和分析验证过程。这是我写这本书的第二个原因,希望能填补缺口,让读者不但知其然,也知其所以然。 从2000年至今的20年里,我一直从事各种数据库相关的应用发和管理工作,尤其是近年来一直跟MySQL数据库交道。从*简单的单实例,到各种复制,再到集群以及与中间件的配合,在其使用上积累了一些经验和心得。这是我写这本书的第三个原因,希望将它们加以归纳和总结,汇集成书与读者分享。

数据科学领域元老级学者倾力造,SAP全球副总裁推荐畅销九个国家和地区,被20余所大学作为教科书数据科学商业应用的门指南,现代企业科学经营手册不同于其他讲述数据科学的书,本书从非数据科学人员,也就是管理者、投资者甚至工程师等人员的角度,阐述了数据科学这一新兴行业的基本原理和基础理念,而这正是本书的惊艳之处。在现代社会中,数据即商业,它是提升生产力、促创新和获取用户洞见的基础,数据思维和分析方法可谓是新时代的商战孙子兵法,只有善用数据者才能在这个数据驱动的环境中获得竞争优势。本书通过大量真实的商业问题案例,介绍数据科学的基本原理和各种数据挖掘技术,阐释如何从数据中提取出有用信息,而用数据科学方法解决商业问题,做出精准的决策。

MongoDB数据库技术的掌握:包括基本的文档模型概念和数据操作,以及集群高可用、数据分片方面的知识。 ? MongoDB整合微服务的技能:需要对微服务周边的技术框架有一定的掌握。本书以当前*流行的 Java 微服务技术栈为背景,介绍了从MongoDB Java Driver、Spring Data Mongo(ODM层)到上层应用整合的各种实战范例。 ? MongoDB高阶技巧的掌握:包括MongoDB系统性能调优及MongoDB 架构高可用、安全性、高效运维管理方面的一些知识和经验。

Kafka*初是由LinkedIn公司发的消息系统,现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统,随着版本的不断迭代,在0.10.x版本之后Kafka已成为一个分布式流数据处理平台,特别是Kafka Streams的出现,使得Kafka对流数据处理变得更加简单。Kafka发展至今已具备很多特性,如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等,也正是由于Kafka具备这些特性,使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排,由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时,Kafka核心组件各成一节;讲解Kafka基本操作及应用实践时,从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系,读者可以从其中

1.从实践角度介绍如何将网站可靠性工程的实践应用于数据库架构和运维,为想成为数据库可靠性工程师的专业人士提供一个指导框架,发人员、系统管理员和初中级数据库管理员等都能从中受益。 2.首先介绍数据库可靠性工程师需要掌握的核心运维概念,然后介绍各种数据库持久性选项,包括如何利用关键技术提供有弹性、可扩展、高性能的数据存储和检索。有了数据库可靠性工程的坚实基础,读者便能深研究任何现代数据库的架构和运维。 -服务等级要求和风险管理 -构建并演具有运维可见性的架构 -基础设施工程和基础设施管理 -如何推动发布管理流程 -数据存储、索引和复制 -明确数据存储的特性和用例 -数据存储架构组件和数据驱动的架构

本书的显著特色是各部分功能基本都结合案例行讲解,可帮助读者快速掌握利用Microsoft Power BI行商业数据分析的专业方法与实战技能。

对于金融科技的从业者,这是一个全新的时代。从B/S到SOA再到中台架构,标志着IT建设到了深水区,一方面IT系统不再是简单的信息保存,而是业务数据化,利用数据驱动业务;另一方面IT系统不再是简单的从业务需求转化为系统实现,而是需要通过可复用能力支撑甚至引导业务需求。本书通过七个部分,论述了金融企业中台的背景、目标、原则与分工、业务中台/数据中台/技术中台的实施方法、成熟度评估原则,这也是作者从SOA架构到中台架构、从平台化到中台化里程碑的总结。

本书适合作为高等院校相关专业的实用统计分析实验教材,也适合相关专业本科生、研究生以及从事统计分析和决策等领域的读者学习参考。

本书*版出版以后,已经被互联网公司广泛采用,作为商业化相关部门的培训教程。新版更注重从人工智能方法论的视角审视整个计算广告体系。通过本书对计算广告领域抽丝剥茧的解读,读者会认识到,除解决传统的感知和认知问题以外,人工智能领域形成的方法体系在广告这样的海量数据驱动且人类自身能力不强的问题上,有着巨大的施展空间。 希望本书能帮助读者深了解互联网流量与数据变现,洞察互联网增长与财富的秘密,搭建商业化与获客的产品技术体系。 用计算的力量改变世界是每一个程序员的梦想,而本书的主题正是用计算将数据和流量变成财富。这样的后向变现使得许多对用户有价值但直利润微薄的信息产品,在互联网时代找到了爆发式成长的机会。从这个角度来看,我们希望本书能够成为一本启示录,帮助每一个互联网人真正理解后向变现对于

本书是一本广受好评的Cassandra图书。

本书注重理论结合实践,既介绍大数据驱动的智能车间技术体系框架,深介绍每项技术解决的问题,又介绍各项技术的具体应用场景与企业实际案例,突出前沿大数据技术在智能车间中的实用价值。

本书基于Neo4j数据库3.5版本及其对应的ALGO和APOC扩展包,详细介绍了近二百个主要过程和函数的定义、相关理论、使用方法、代码样例,让广大Neo4j图数据库的设计和发人员能够快速掌握正确和高效的图数据库分析方法及其应用发技能。

《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例

暂无

本书从MySQL DBA新手的视角出发,详解MySQL 8数据库管理系统,引导初学者在较短的时间内掌握MySQL数据库管理技术。

本书以Hadoop和Spark框架为线索,重介绍了Hadoop技术、Spark技术、大数据存储、大数据访问、大数据采集、大数据管理、大数据分析、大数据发、大数据环境自动化部署等内容,使读者对大数据技术有个比较全面的了解。

本书基于EViews 10.0版本,精选68个专业范例,以实验教程的形式讲解应用EViews工具解决各种统计分析问题,针对每一个实验,都遵循从 原理、目的与要求、内容及数据来源、操作指导 几个方面行讲解,达到理论与实践相结合,掌握统计学和计量学的方法和模型的应用。 章后精选27个上机练习题,动手实践,一步巩固所学的知识,提高动手操作能力和数据分析能力。 本书覆盖90%以上的统计模型,可作为即查即用的EViews使用手册。

1.本书的编写团队写作经验丰富,有来自北京邮电大学的教授从事大数据工作的从业者; 2.本书内容深浅出,技术结合丰富的场景故事,通俗易懂,概念新颖,思想创新; 3.本书结合新颖案例帮助相关的技术人员或大数据的初学者了解大数据的相关知识。


暂无


介绍大数据发展趋势和基于Spark的生态环境,全面系统地提供Spark发的基础知识,提供基于Docker容器发环境和编程实例,引导Spark技术学习者快速门,系统的掌握Spark的编程技术。

在这里,有面试笔试常见技巧的提炼与总结; 在这里,有面试笔试高频数据库知识的整理与剖析; 在这里,有面试笔试历年数据库真题的解答与拓展。

本书内容严谨精细、生动活泼,从内容来看,共分为四大部分,共11章。

1.描述的模型范围广泛,以影响力传播模型为主,兼顾选举模型、博弈论模型、传染病模型等网络传播模型。 2.对模型之间的关系作了一定阐述。这是研究论文中很少涉及的,在其他综述性文章和专著中也涉及不多。模型的比较分析有利于研究者和实践者分清模型的适用场合,更有的放矢地应用也有成果。 3.包括网络传播中的*模型和算法,如基于反向可达集合的影响力*化算法、基于Shapley值的网络影响力中心度算法、包含竞争和互补关系的传播模型和算法等。 4.数学和算法描述描写深,使得本册图书区别于一般综述性文章,能够给读者了解从事这方面研究的关键技术内容和背景。

Greenplum是业界领先的源MPP大数据平台。2019年,Greenplum被Gartner评为全球 排名第三 的分析型数据库和 排名第四 的实时分析数据库,且为前十名中 *源的产品 。中国信息通信研究院评测的14款MPP数据库中 约半数基于Greenplum。本书由 Greenplum核心研发团队精心编写,融了团队十余年来对云计算、大数据和人工智能驱动的企业数字化转型、先技术发展趋势以及产品研发的深刻思考,对Greenplum这款快速成长的源大数据平台行了全方位深度解读,无论是企业决策者,还是大数据相关的技术人员,都能从本书中获益。



暂无

数字孪生(Digital Twin)是近些年比较火的技术概念,数字孪生技术充分利用物联网、大数据、人工智能、3D可视化等技术,基于历史数据、实时数据以数字化的形式创建物理实体的虚拟实体,也称作数字孪生体。 本书以数字孪生在数据中心中的应用为主题,从采用的方案、遇到的问题、解决的方法及对未来思考等方面,全面介绍数字孪生技术实践的细节。重介绍了构建数字孪生体需要的三个步骤 数据获取、数据分析、数据展示,即通过实际业务获取数据,借助人工智能技术对数据分析,通过3D可视化技术完美呈现了物理实体对应的数字孪生体。 本书介绍了数字孪生技术的落地实践,适合对数字孪生有兴趣的发人员阅读。

暂无

暂无

本书系统讲解Hadoop生态圈各组件的核心知识、操作方法和分析技术,并通过两个综合实战项目 影评大数据分析、旅游酒店评价大数据分析,来贯穿Hadoop大数据分析的完整流程。

数据融合归因分析 解释性研究 数据挖掘风险预警 信用评估监控系统

暂无

本书精解数据结构重知识、典型习题及其解答思路,对数据结构的主要内容行梳理,并筛选历年典型的计算机专业考研试题、算法竞赛试题、软考试题以巩固所学的知识。本书适合C语言数据结构与算法的初学者、考研人员、算法竞赛人员、软考人员以及高校相关课程的师生参考。

任务驱动、内容丰富、结构合理、思路清晰、语言简练、图文并茂,所选实例具有很强的实用性和可操作性。作者三十余年一线教学经验。☆ 计算机公共基础课教材、计算机等级考试应试参考教材、PPT等。☆ 配套资源下载(华信教育资源网:www.hxedu.com.cn)

从数据思维到数据分析及挖掘算法 每个算法均有Python代码实现 可加读者交流群,与作者互动


本书对天文信息学领域的专家具有一定借鉴价值,适合作为天文信息学、数据挖掘、人工智能等研究方向的科研人员和研究生的参考用书。

★ 系统思考领域的佼佼者、畅销书《复盘 》作者新作 ★ 华章出版图书《如何系统思考(第2版)》,选由中共江苏省委宣传部、江苏省全民阅读活动领导小组举办的,2021年江苏省全民阅读活动领导小组向社会推荐的 十二本好书 之一 ★ 全新升级版,六大方面修订,新增150多页内容 ★ 第五项修炼 实践指南 ★彼得 圣吉、张玉利、陈劲、孙陶然、俞敏洪、陈玮、盛希泰、王玥等2 0 位学者、企业家联袂推荐 ★当下社会,人的核心能力是应对复杂性挑战的思考能力,但重塑自己的思维模式非常困难。邱昭良博士以 思考的魔方 为框架,以实用的方法与工具、丰富的案例,带领我们实现思维的三重转变,让你学会系统思考 。

全书共分3部分,是《数据库原理 GaussDB技术及应用》一书配套的辅助教材。

如何释放MySQL的全部能量?通过《高性能MySQL》(第4版),你将学习到各种高级技术,包括设置服务器级别目标,设计schema、索引和查询,调整服务器、操作系统和硬件,以充分发挥平台的潜力。本书还向数据库管理员介绍了通过复制、负载均衡、高可用性和故障切换来扩展应用程序的安全且实用的方法。 《高性能MySQL》(第4版)旨在反映云和自托管MySQL的展、InnoDB性能,以及新特性和新工具,可以帮助你设计一个可随业务扩展的关系数据平台。你将学习到数据库安全方面的实践,以及在性能和稳定性方面来之不易的经验。 深了解MySQL的体系结构,包括其存储引擎的关键事实。 了解服务器配置如何与硬件和部署选择配合使用。 让查询性能成为软件交付过程的一部分。 检查MySQL复制和高可用性的增强功能。 比较托管云环境中的不同MySQL产品。 探索MySQL从应用端配置到服务

这是一本理论与实践并重的工具书。其中的理论具有通用性,适用于任何可视化场景,具有理论维度的广度;实践部分专注于BI 工具中处于领导者地位的Power BI,具有工具维度的深度。

华为公司官方出品,曝光华为分布式数据库openGauss的系统架构,掌握软件与硬件结合的核心技术!中国人民大学教授王珊,中国工商银行软件发中心总经理杨龙如,中国邮政储蓄银行CIO牛新庄联袂作序!

三位拥有多年DBA实战经验的作者的用心总结,从增删查改、索引、锁、事务、体系结构、日志文件等基础知识,到优化、主从复制、安全、备份、分库分表、周边工具、新特性、主流高可用方案、云时代工作等高级实战话题,全面、详细地讲解MySQL核心技术。大部分知识带有对应实验,方便读者理解。


Neo4j首席科学家Jim Webber、WPS创始人求伯君、360公司创始人周鸿祎、国防大学教授胡晓峰、电子科技大学教授周涛 隆重推荐。 中国IT界元老、中国图数据库先导者、Neo4j简体中文版总设计师、大数据领域资深专家、WPS曲线汉字技术发明人 张帜 主编。

本书采用双色印刷,部分重图片可扫码观看彩图。本书采用次加大本印刷,使代码的阅读更加方便。 本书与常规介绍SAS、R语言、Stata和Python等统计软件的书籍的区别在于避免只讲统计分析而忽略如何高效、准确地提取主要结果,如何生成可直用于汇报、交流或达到SCI发表要求的表格。 本书立足于目前大数据研究的现状分三步行讲解。首先强调必须掌握的数学和统计学基础知识;其次,根据真实世界的电子病历及健康注册系统的数据特征,模拟出与其复杂程度和处理难度相当的模拟数据库;再次,针对同一研究问题,在SAS、R语言、Stata和Python中行同步处理,详细讲解如何在这4个统计软件中实现从数据导、数据清洗、统计分析、整理输出结果(表格或图)到结果解释的全部过程,从而可完成软件的对比学习,达到事半功倍的效果。以上3也是本书的特色所在。 笔者

遨游海域的座头鲸、成群结队的角马、群聚飞翔的火烈鸟 构成了一幅幅壮美的生存画面,迁徙是自然界令人叹为观止的景观。 数智时代的 上云 与自然界的 迁徙 何其相似啊! 2021年伊始,我们博文视的编辑团队联合阿里云技术团队,为广大IT技术人员奉上 阿里云数字新基建系列 。这个系列包括5本书,题材涉及Kubernetes、混合云架构、云数据库、CDN原理与流媒体技术、云服务器运维(Windows),囊括了领先的云技术知识与阿里云技术团队独到的实践经验,是国内IT技术图书中又一套重磅作品! 关于本书《云数据库架构》: (1)阿里云数据库产品事业部总裁、达摩院数据库与存储实验室负责人李飞飞力荐,全彩印刷,厚352页。 (2)详解云数据库领域各种引擎的特与原理,助你理解数据库架构的选型要!阿里云数据库专家朱明 李森 许文科 江厚顺 王超 郭宁 余

融会贯通,将各类建模技术综合应用于商业运营实践 聚焦商业热,有效解决市场调研、市场营销、客户满意度调研、连锁门店分类管理、客户关系分级维护等核心问题,提升商业价值和核心竞争力 满足职场人士和统计分析相关专业师生行统计分析和数据建模的需求


(1)ClickHouse被称为*快的数据库,受到国内众多企业的追捧,尤其是在OLAP领域,ClickHouse将成为性能的保障。 (2)ClickHouse的中文资料非常少,本书作为全面介绍ClickHouse的中文图书,不仅会为国内读者带来学习上的便利,对全球范围内的发展也会产生积极作用。 (3)本书内容全面,从基础到原理、从理念到实践都有深度介绍,初中级读者通过这一本书就能充分掌握ClickHouse。