
1.全书侧重实用性,涵盖从数据的采集、可视化到数据的持久化等各个方面的内容,帮助读者提升自主解决挑战性问题的能力; 2.本书包括如何设置组件、基础的Demo演示、系统集成、高级用例,以及报警和监控等主题,旨在帮助读者了解当今流行的实时处理工具,如Apache Spark、Apache Flink和Storm; 3.本书结合实际用例展示上述技术的具体应用,真正将理论运用到实践中,解决实际问题; 4.通过阅读本书,读者可以掌握实时数据处理和分析的相关知识,并能了解如何以*恰当的方式在生产环境中部署解决方案。

读者对象 本书适合想从事数据库程序员行业或即将参加数据库程序员面试求职的读者阅读,也可作为计算机相关专业毕业生的求职指导用书。 ★★精心甄选IT名企面试笔试、岗位测评、选拔晋升中涉及的经典编程题目(98%真题和真题演绎)。 ★★精准涵盖编程基础、核心技术、框架涉及、数据结构及算法等编程核心主题(100%解析透彻)。 ★★精心解析各类面试笔试中的高频考及难(100%场景模拟)。 ★★超值赠送职业规划库、软件技术库、面试资源库、求职资源库、本书全部源代码、编程水平测试系统、软件学习工具及电子书资源库。 读者对象 ★★准备从事数据库程序员工作的人员。 ★★准备参加数据库程序员求职面试的人员。 ★★正在学习软件发等计算机相关专业的毕业生。 ★★准备从事软件发行业的计算机爱好者。

本书基于Tableau 2020.1编写,结合编者十余年数据分析行业从业经验,详细介绍了该版本的数据连功能、图形编辑与展示功能,包括软件的安装与激活、数据类型和运算符、连数据源、基础操作、数据与图形的导出、连大数据、基础图表、函数、高级数据操作、地图分析、故事、Tableau Online、Tableau Server等内容。可以帮助读者快速掌握软件使用并应用于工作实践。

认识和学习知识图谱技术的敲门砖 这里有知识图谱技术的相关概念和发展趋势及挑战解析 这里有知识图谱技术在多个行业的实际应用和案例分析 中国信通院专家倾情撰写和推荐

本书第 1版出版以后,获得的业界反响超乎了我们的想象。实际上,本书已经广泛被互联网公司采用,作为商业化相关部门的培训教程,甚至还成了某大公司商业化部门年会时的 阳光普照奖 奖品。 经过一段时间的补充与修订,我们向读者奉上这次的新版,希望本书能帮助读者深了解互联网流量与数据变现,洞察互联网增长与财富的秘密,搭建商业化与获客的产品技术体系。 对以下读者,我们相信本书值得一读: ● 互联网公司的商业化、大数据和用户增长部门的朋友; ● 传统广告与数字广告从业者; ● 对推荐、大数据、人工智能技术的应用有兴趣者; ● 转型中的传统企业和创业公司的战略决策者; ● 计算机相关专业学生。 在新版中,我们特别注重了从人工智能方法论的视角审视整个计算广告体系。通过本书对计算广告领域抽丝剥茧的解读,读者会认识到,

暂无

MySQL主从原理是高可用架构的基石。 本书彻底地分析了MySQL主从原理。 本书是作者多年来研究MySQL原理和实践的成果。 MySQL从业人员应人手一本备在身边,以防不时之需。

网上关于MySQL的资料比比皆是,但大部分都是针对单一具体问题的解答,例如如何配置MySQL双主复制等,全面系统讲述MySQL高可用这方面的资料并不多见。而且,这些资料大多只给出简单的实现方法,缺少相应的理论背景知识和分析验证过程。这是我写这本书的第二个原因,希望能填补缺口,让读者不但知其然,也知其所以然。 从2000年至今的20年里,我一直从事各种数据库相关的应用发和管理工作,尤其是近年来一直跟MySQL数据库交道。从*简单的单实例,到各种复制,再到集群以及与中间件的配合,在其使用上积累了一些经验和心得。这是我写这本书的第三个原因,希望将它们加以归纳和总结,汇集成书与读者分享。


MongoDB数据库技术的掌握:包括基本的文档模型概念和数据操作,以及集群高可用、数据分片方面的知识。 ? MongoDB整合微服务的技能:需要对微服务周边的技术框架有一定的掌握。本书以当前*流行的 Java 微服务技术栈为背景,介绍了从MongoDB Java Driver、Spring Data Mongo(ODM层)到上层应用整合的各种实战范例。 ? MongoDB高阶技巧的掌握:包括MongoDB系统性能调优及MongoDB 架构高可用、安全性、高效运维管理方面的一些知识和经验。

Kafka*初是由LinkedIn公司发的消息系统,现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统,随着版本的不断迭代,在0.10.x版本之后Kafka已成为一个分布式流数据处理平台,特别是Kafka Streams的出现,使得Kafka对流数据处理变得更加简单。Kafka发展至今已具备很多特性,如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等,也正是由于Kafka具备这些特性,使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排,由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时,Kafka核心组件各成一节;讲解Kafka基本操作及应用实践时,从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系,读者可以从其中

本书的显著特色是各部分功能基本都结合案例行讲解,可帮助读者快速掌握利用Microsoft Power BI行商业数据分析的专业方法与实战技能。

对于金融科技的从业者,这是一个全新的时代。从B/S到SOA再到中台架构,标志着IT建设到了深水区,一方面IT系统不再是简单的信息保存,而是业务数据化,利用数据驱动业务;另一方面IT系统不再是简单的从业务需求转化为系统实现,而是需要通过可复用能力支撑甚至引导业务需求。本书通过七个部分,论述了金融企业中台的背景、目标、原则与分工、业务中台/数据中台/技术中台的实施方法、成熟度评估原则,这也是作者从SOA架构到中台架构、从平台化到中台化里程碑的总结。

1.本书提供Mooc等辅助教学资源,方便教学。2.每章*后小节给出一个完整项目实践案例,帮助读者系统理解数据库技术应用方法。解决传统教材理论知识与产业工程实践脱节、工程案例偏少的问题。3.本书第7章介绍了目前大量应用的NoSQL数据库技术及其应用方法,如键值对数据库、列存储数据库、文档数据库、图形数据库等技术知识。


1. 强调实战2. 覆盖大数据行业主流技术岗位,紧跟市场与企业步伐3. 来自企业的骨灰级大咖授课4. 内容结构完整,根据循序渐的认识规律设计章节顺序

本书适合作为高等院校相关专业的实用统计分析实验教材,也适合相关专业本科生、研究生以及从事统计分析和决策等领域的读者学习参考。

机器学习的应用是高度自度化且自动修正的。学习到的数据越多,机器学习应用需要的人工干预越少。为了解决现实世界中复杂的数据问题,科学家们发出专门的机器学习算法来解决这些问题。数据科学正是通过算法和统计分析来帮助读者从现有数据中获取新知识的。 本书将解决如何高效地行数据分类及预测的问题。本书主要讲解7种数据科学算法,有k*近邻算法、朴素贝叶斯算法、决策树、随机森林,k-means聚类、回归分析和时间序列分析。 此外,你还会掌握如何对数据行预聚类,以便针对大型数据集行优化和分类。*后,你将了解如何根据数据集中的现有趋势来预测数据。本书的各章还有配套的练习题,以帮助你夯实内容,扩展相关知识。读完本书后,你将了解如何选择机器学习算法行聚类、分类或回归,并知道选择哪种算法来解决实际问题。 本书主要包括以下

本书是一本广受好评的Cassandra图书。

本书注重理论结合实践,既介绍大数据驱动的智能车间技术体系框架,深介绍每项技术解决的问题,又介绍各项技术的具体应用场景与企业实际案例,突出前沿大数据技术在智能车间中的实用价值。

本书基于Neo4j数据库3.5版本及其对应的ALGO和APOC扩展包,详细介绍了近二百个主要过程和函数的定义、相关理论、使用方法、代码样例,让广大Neo4j图数据库的设计和发人员能够快速掌握正确和高效的图数据库分析方法及其应用发技能。

《数据决策:企业数据的管理、分析与应用》详细介绍了数据战略规划,企业数字化运营,客户智能运营,业务主题优化,行业应用案例

暂无

本书从MySQL DBA新手的视角出发,详解MySQL 8数据库管理系统,引导初学者在较短的时间内掌握MySQL数据库管理技术。

(1)本书以基本概念与实例相结合的方法,由浅深、循序渐地对大数据思维、技术和应用做了全面系统的介绍。(2)本书在每一个环节都配有与理论学习内容相结合的案例介绍,还有使用Java和Python语言编写的应用实例,使读者能够在大数据平台上通过实践亲身体验大数据处理和分析的过程,从而加快和加深对大数据理论和技术的理解。(3)为了使读者方便检验和复习巩固学习到的知识,本书每章后面都配有丰富的作业供学生完成。

(1)本书是国家精品课程“计算机基础”系列课程“数据库原理与技术”的主教材,也是国家精品资源共享课配套教材。 (2)采用Access 2013版本为操作平台介绍。 (3)理论与实践相结合,还安排有综合实例介绍,实用性强。

本书以Hadoop和Spark框架为线索,重介绍了Hadoop技术、Spark技术、大数据存储、大数据访问、大数据采集、大数据管理、大数据分析、大数据发、大数据环境自动化部署等内容,使读者对大数据技术有个比较全面的了解。

本书包含了2009年研究生学统考大纲的全部内容。本书讨论的典型数据结构问题。对于线性表、堆栈、队列、串、数组、广义表、树、二叉树和图等基本数据结构问题,都详细讨论了各自的逻辑结构、存储结构以及各种算法的设计方法。排序和查找是两个应用广泛的算法设计问题,本书讨论了几种典型的排序算法,讨论了静态查找、动态查找和哈希查找的存储结构和查找方法。广义表、树、二又树和图这些非线性结构的算法经常要设计成递归算法,本书专设一章讨论递归算法的设计方法等问题。

本书基于EViews 10.0版本,精选68个专业范例,以实验教程的形式讲解应用EViews工具解决各种统计分析问题,针对每一个实验,都遵循从 原理、目的与要求、内容及数据来源、操作指导 几个方面行讲解,达到理论与实践相结合,掌握统计学和计量学的方法和模型的应用。 章后精选27个上机练习题,动手实践,一步巩固所学的知识,提高动手操作能力和数据分析能力。 本书覆盖90%以上的统计模型,可作为即查即用的EViews使用手册。


1.本书的编写团队写作经验丰富,有来自北京邮电大学的教授从事大数据工作的从业者; 2.本书内容深浅出,技术结合丰富的场景故事,通俗易懂,概念新颖,思想创新; 3.本书结合新颖案例帮助相关的技术人员或大数据的初学者了解大数据的相关知识。



总序 短短几年间,大数据就以一日千里的发展速度,快速实现了从概念到落地,直带 动了相关产业井喷式发展。全球多家研究机构统计数据显示,大数据产业将迎来发展黄 金期:IDC 预计,大数据和分析市场将从2016 年的1300 亿美元增长到2020 年的2030 亿美元以上;中国报告大厅发布的大数据行业报告数据也说明,自2017 年起,我国大数据 产业将迎来发展黄金期,未来2~3 年的市场规模增长率将保持在35%左右。 数据采集、数据存储、数据挖掘、数据分析等大数据技术在越来越多的行业中得到 应用,随之而来的就是大数据人才问题的凸显。麦肯锡预测,每年数据科学专业的应届 毕业生将增加7%,然而仅高质量项目对于专业数据科学家的需求每年就会增加12%,完 全供不应求。根据《人民日报》的报道,未来3~5 年,中国需要180 万数据人才,但目 前只有约30 万人,人才缺

在这里'; 有技术大咖面试笔试经验与技巧的提炼与总结 '在这里'; 有各大IT名企高频的数据库面试笔试真题 '在这里'; 有作者团队庖丁解牛式的解析与答案



暂无


国内专业DB2论坛db2china 鼎力支持

《希赛教育?全国计算机技术与软件专业技术资格(水平)考试用书:数据库系统工程师考试历年试题分析与解答(第4版)》可作为数据库系统工程师的考试用书,也可作为程序员和软件设计师的参考书籍。


介绍大数据发展趋势和基于Spark的生态环境,全面系统地提供Spark发的基础知识,提供基于Docker容器发环境和编程实例,引导Spark技术学习者快速门,系统的掌握Spark的编程技术。

在这里,有面试笔试常见技巧的提炼与总结; 在这里,有面试笔试高频数据库知识的整理与剖析; 在这里,有面试笔试历年数据库真题的解答与拓展。

1.描述的模型范围广泛,以影响力传播模型为主,兼顾选举模型、博弈论模型、传染病模型等网络传播模型。 2.对模型之间的关系作了一定阐述。这是研究论文中很少涉及的,在其他综述性文章和专著中也涉及不多。模型的比较分析有利于研究者和实践者分清模型的适用场合,更有的放矢地应用也有成果。 3.包括网络传播中的*模型和算法,如基于反向可达集合的影响力*化算法、基于Shapley值的网络影响力中心度算法、包含竞争和互补关系的传播模型和算法等。 4.数学和算法描述描写深,使得本册图书区别于一般综述性文章,能够给读者了解从事这方面研究的关键技术内容和背景。




暂无

数字孪生(Digital Twin)是近些年比较火的技术概念,数字孪生技术充分利用物联网、大数据、人工智能、3D可视化等技术,基于历史数据、实时数据以数字化的形式创建物理实体的虚拟实体,也称作数字孪生体。 本书以数字孪生在数据中心中的应用为主题,从采用的方案、遇到的问题、解决的方法及对未来思考等方面,全面介绍数字孪生技术实践的细节。重介绍了构建数字孪生体需要的三个步骤 数据获取、数据分析、数据展示,即通过实际业务获取数据,借助人工智能技术对数据分析,通过3D可视化技术完美呈现了物理实体对应的数字孪生体。 本书介绍了数字孪生技术的落地实践,适合对数字孪生有兴趣的发人员阅读。

暂无

本书系统讲解Hadoop生态圈各组件的核心知识、操作方法和分析技术,并通过两个综合实战项目 影评大数据分析、旅游酒店评价大数据分析,来贯穿Hadoop大数据分析的完整流程。

数据融合归因分析 解释性研究 数据挖掘风险预警 信用评估监控系统

暂无

系统介绍XBRL数据特和分类标准架构,讨论分析XBRL数据合理存储方案,详细设计XBRL实例生成器发流程,探讨解决XBRL数据传输安全机制,服务于计算机软件发和应用、会计电算化信息管理等领域的专业人员。 本书分13个章节,分析了XBRL数据的生成、存储、展示、安全机制及应用实例等XBRL关键技术,解读了XBRL财务报告分类标准架构,并论述了XBRL实例生成器原型系统的发流程,具体内容包括XBRL技术原理、XBRL格式数据特、XBRL面向对象的实体建模分析、XBRL实例生成工具研究与发、XBRL的一致性分析、XBRL数据存储方案等。该书可供各大专院校作为教材使用,也可供从事相关工作的人员作为参考用书使用。

本书精解数据结构重知识、典型习题及其解答思路,对数据结构的主要内容行梳理,并筛选历年典型的计算机专业考研试题、算法竞赛试题、软考试题以巩固所学的知识。本书适合C语言数据结构与算法的初学者、考研人员、算法竞赛人员、软考人员以及高校相关课程的师生参考。

任务驱动、内容丰富、结构合理、思路清晰、语言简练、图文并茂,所选实例具有很强的实用性和可操作性。作者三十余年一线教学经验。☆ 计算机公共基础课教材、计算机等级考试应试参考教材、PPT等。☆ 配套资源下载(华信教育资源网:www.hxedu.com.cn)

从数据思维到数据分析及挖掘算法 每个算法均有Python代码实现 可加读者交流群,与作者互动


本书对天文信息学领域的专家具有一定借鉴价值,适合作为天文信息学、数据挖掘、人工智能等研究方向的科研人员和研究生的参考用书。