
从哲学、数学、物理、统计,到测量、实验、辩证、分析,用谈天说地的方式激发思考,归纳总结数据科学的实质及成就一位数据科学家所需要的基本素养。

从Power BI到Analysis Services:企业级数据分析实战
1.越来越多的企业已经或者正在将本地IT系统升级到云端,这其中就包括将本地Analysis Services迁移到Azure Analysis Services的过程。 2.本书详细解析本地与Azure Analysis Services企业级数据分析解决方案的图书。从工具安装与配置、数据获取与清理、模型搭建与部署、发工具与应用等角度,为数据分析人员、企业 IT 人员提供专业的 BI 数据工程知识。 3.微软认证MVP、微软DATA AI云架构师联合造,从理论出发,着手实践,适合IT、DT人员以及希望提高微软数据平台技术的读者阅读。 4.微软大中华区副总裁邓?S、微软大中华区全渠道事业部CTO徐明强、技术总监王盛麟、 PowerPivot 工坊 创办人赵文超联袂推荐。

Kyligence 联合创始人兼 CEO , Apache Kylin 项目管理委员会主席( PMC Chair )韩卿 武汉市云升科技发展有限公司董事长, 《 智慧城市 大数据、物联网和云计算之应用 》作者 杨正洪 万达网络科技集团大数据中心副总经理,《 Spark 高级数据分析》中文版译者龚少成 数据架构师, IT 脱口秀(清风那个吹)创始人,《开源大数据分析引擎 Impala 实战》作者贾传青 等等业内专家联合推荐 Apache Kylin 将传统的数据仓库及商务智能分析能力带入到了大数据时代,作为新兴的技术已经被广大用户所使用。作为创始作者,我非常欣喜能看到关于 Apache Kylin 相关书籍的出版, 这无疑对中国用户更好地使用 Kylin ,解决实际的大数据分析架构及业务问题有很大帮助。 韩卿 Kyl

Hadoop大数据开发案例教程与项目实战(在线实验+在线自测)
内容新颖,可操作性强,层层深,简明易懂。从实用角度出发,重培养动手解决问题的能力。提供体系完整的100学时在线实验,即学即练,书网结合。96个案例实战(课程配套案例36个、扩展案例60个)和50余套自测题,附赠PPT课件、案例源代码、视频等资源。

投资大师科斯托拉尼股市箴言 一段股市精彩人生的回放 一位*伟大的投资家的遗赠

经济的发展,社会的步,城市的扩张带给人类前所未有的物质财富和精神文明。对于人类而言,人类似乎在操控着自然的命运,人类在消耗着自然资源,生产着供人类生活的产品并排放废弃物。在人类社会发展的同时,地球上的资源却在日益减少,环境也遭到了破坏。在这种情况下,全球兴起了 绿色 浪潮,绿色化运动在各个领域渗透。 鉴于此,我们策划了《绿色环保从我做起》丛书,希望通过这套丛书让青少年及大众更方便、更快捷的认识并理解环保知识和方法,同时,通过这套丛书可以拉近公众与环保新科技的距离。 《绿色云计算》为《绿色环保从我做起》的一分册, 本书通过生动有趣的漫画和深浅出的文字,向读者介绍了绿色云计算基础知识、云计算的关键技术、企业在云计算领域成果、云计算的安全性、绿色云计算的应用及云计算的未来发展等。

数据分析门书,被译成8国语言,网易创始人丁磊曾发动公司全员学习本书 内容全面校订,增补图灵社区访谈作者全文 精益创业运动创者埃里克 莱斯作序推荐 王诗沐、史凯、邱岳、范冰、张溪梦、徐小磊、猴子、曾加联合推荐

1.MongoDB团队成员撰写,带你门主流NoSQL数据库; 2.第1版、第2版累计发行5万册,第3版对TTL和聚合管道等新特性行了讲解,还增加了配置MongoDB的章节; 3.内容适合MongoDB 4.2及以上版本。 如果你希望使用支持现代应用程序发的系统来管理数据,那么MongoDB是不错的选择。作为面向文档的NoSQL数据库,MongoDB功能多、灵活且易于扩展,在DB-Engines数据库流行度排行榜上名列前茅。 本书是由MongoDB团队成员撰写的门指南,涵盖从发到部署的各个方面,内容适合MongoDB 4.2及以上版本。无论你是NoSQL新手还是有经验的MongoDB用户,都可以在查询、索引、聚合、事务、副本集、分片、监控和安全等方面收获新的知识。 ●使用MongoDB执行写操作、查找文档并行复杂的查询 ●对集合行索引,对数据行聚合,在应用程序中使用事务 ●配置本地副本集,并了解复制机制如何与应用程序交互 ●创建

1.畅销经典教材。本书为修订教材第3版,配有习题与实验指导用书。主教材前2版累计印刷28次,累计库68200多册。 2.软件版本更新。Access数据库版本由2010版升级到2016版,增加了Access 2016提供的新功能,可以满足实际应用的需要。 3. 根据全国计算机等级二级考试需求编写。章节框架与Access全国计算机等级考试大纲相一致,内容上一步贴近等级考试要求,配有针对性实验与习题。 4.资源丰富详实。本书资源包括配套习题与实验指导、多媒体课件、课程大纲、相关习题答案等。

适读人群 :数据分析爱好者、统计分析专业人士 读者不需要任何统计学知识,也没必要掌握复杂的公式与算法,在通俗易懂的案例介绍和娓娓道来中就可以轻松理解大数据分析的基本模式与方法。


工业设计产业园区作为设计产业的公共服务平台,起到了承上启下的作用。对于工业设计园区的考察一定程度上反映了设计产业链的整体状况,并基于此进一步辐射至企业、设计师、各个行业中。设计园区*主要的特点就是 政产学研商 相结合,依托所在地的产业集群,在跨界、交叉学科、人才 集聚 的基础上,逐渐融合、构筑合理的产业链系统,以形成 园区 所在区域的产业创新机制的孵化温床。政府亦可通过 园区 这个公共服务平台,以 四两拨千斤 ,扶持、引导区域产业链中各个方面的对接与整合,加快经济转型升级的步伐。



以Hadoop、Spark两大生态系统为基础,以大数据背景、软件、采集、存储、处理、分析、可视化、安全以及应用为线索,结合Flume、Sqoop、HDFS、HBase、Kafka、Kylin、Hive、Redis、MongoDB等主要组件技术,详解大数据技术基础。

这是一本场景时代的内容玩法书,也是提供新武器的运营魔法书;是一本写给内容产品经理看的书,也是一本全新的品牌传播秘籍。本书内容涉及内容产品化、数据新运用、用户新互动、运营新思路、传播新策略等多个领域,但读完本书你会觉得它们完全能够融合为一体,应该协同生产。想了解其中的奥秘吗?翻本书看一看吧!

总结提炼全球数字经济发展新态势和新动向; 梳理世界主要国家的数字经济政策发展沿革; 提出中国数字经济体系框架并行梳理; 整理中国数字经济排名前十省份的数字经济政策出台特征,对中国数字经济政策的制定提出展望。

1、PingCAP是国内一家企业级源分布式数据库厂商,连续28个月墨天轮国产数据库流行度排名TOP。本书从技术选型、社区生态、国际合作等方面完整表达了PingCAP对源和数据库的思考。 2、此书不仅适合做数据库的技术人员阅读,也适合所有有志于了解源、参与源的人士。 3、全书具有源公司的创业故事、对源的历史理解、对数据库的变迁思考和未来发展趋势的研判。 4、书中还有大量用户使用源数据库TiDB,不仅快速、低成本的解决了自身的需求,而且还能够反哺社区实现共同成长的案例。

(1)内容全面,覆盖当前数据挖掘的主要应用。在介绍每个应用案例时,详细阐述应用的背景,该领域中数据的来源和特,数据采集与预处理方式,应用领域中数据挖掘的任务和实施数据挖掘技术的难。同时提供相应的数据挖掘算法分析、工具设计以及系统实现。 (2)条理清晰、便于理解。一方面,面向热爱和关心数据挖掘技术的学术界和工业界读者,帮助他们更好地理解研究的目的和应用的基础;另一方面,让没有太多相关技术背景的读者可以通过阅读本书能够了解数据挖掘的意义和价值,可以看出数据挖掘是如何被广泛地应用于实际案例并成为解决各种问题的核心工具。


本书通过案例讲解分布式数据库HBase,体系结构清晰,内容系统全面、通俗易懂、注重操作。本书配套丰富的教学资源,适合大数据分析与发的初学者以及对大数据感兴趣的技术人员,也适合作为高等院校大数据专业课的前导课程。



1.阿里巴巴、美团评、腾讯、滴滴等数据产品案例,更有实例展示阿里、腾讯的数据产品团队与企业文化,阿里、腾讯数据产品经理的一天工作,阿里、腾讯数据产品经理面试流程与求职经验。既有大公司的数据产品经验案例也有创业团队的经验总结。 2. 道 与 术 。本书不仅有道的层面展示丰富数据产品经理思维方法内容,不仅仅要懂产品层面的数智化需要整体产品团队、技术团队、运营团队有数字化的思维文化,还要懂术的层面支持大量数据分析的新工具流程和数据挖掘的新工具新技术,既在道的层面产品思维方面强调数据产品的思维方法,亦在术的层面也行了数据产品实操。

个人与商业数据的获取和分配如何做到公平正义? 大数据背景下如何调和数据保护与数据经济?

1.本书行版本更新,以新的稳定版HBase 2.4.9为基础,将Hadoop升级到2.10.1版本,对客户端API做了重磅升级。 2.本书专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。 3.本书结合企业需要的“用户行为日志系统”,让读者能够快速上手的同时,做到从门到实践。

1.以实际任务为向导,结合大量数据分析案例,与真实案例相结合。 2.紧扣任务需求,不堆积知识,着重于思路的启发与解决方案的实施。 3.配有微课,提供PPT课件、教学大纲、电子教案、实例和实训素材、实例和实训答案、课后习题答案等教学资源。


1.内容新颖,结构合理 本书结合大数据和数据库系统,从技术历史的角度介绍数据管理系统的发展,既有系统架构的演,又有商业产品的兴衰,适合不同的读者。 2.案例丰富,深浅出 本书有针对性地介绍了如Oracle、IBM、Google等公司数据库和大数据产品的迭代,也介绍了关于Spark、MySQL、TiDB等主流系统的架构设计,同时有对分布式算法、一致性算法等的讲解。从公司、产品、技术、人物等角度列举了诸多实例。 3.配套资源,优化学习 读者可到异步社区网站下载与本书配套的彩图,方便读者提升学习效果

本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训学校相关专业的师生教学参考。

Spark被称为大数据处理王者技术Hadoop的真正挑战者。本书以丰富示例介绍Spark程序和数据挖掘算法设计,更好地帮助Spark开发者提高学习效率。


本书适合企业及互联网数据中心管理者、企业科技部门领导,以及承担数据中心设计、建设及运维的人员阅读。


1.用更行之有效的data.table替代繁琐的iris处理繁琐数据,提高数据处理速度; 2.帮助读者用内存不大的个人笔记本处理大型数据集; 3.提供配套代码文件,方便读者学习练习;


1.本书以一个虚构的餐厅评应用程序为例,完整地展示了图应用程序的构建过程。 2.本书示例采用企业级应用程序的常用语言Gremlin,在不同图数据库产品之间具有较强的可迁移性。 3.完整清晰的学习结构,通过11章内容帮助读者从门到实践,再到阶学习图数据库: 门:掌握基本概念、图数据建模、图遍历。 实践:使用图数据库构建 友聚 应用程序。 阶:分析性能,避免陷阱和反模式。 戴夫和乔希是成绩斐然的图架构师和发人员,我想不出还有谁能更好地引导你踏上理解图数据库的旅程并帮助你规划路线。 Ted Wilmes,JanusGraph技术指导委员会委员 这本书深浅出地介绍了图应用程序的构建过程。无论是对数据建模还是对数据库技术感兴趣的朋友,均可以通过此书领略图数据库的魅力。 付晓岩,IBM副合伙人

本书从理论、系统、应用三个方面详细讲述了大数据的技术知识,并针对NoSQL数据库技术做了深的分享,是学习大数据技术的地图、指南手册。帮助读者跳出迷局,厘清思路,系统地做好相关知识储备,拥抱大数据时代!


现在越来越多的企业始利用数据科学来驱动业务,《数据科学实战指南》将依托TalkingData 在大数据领域的多年实践经验,从数据、人才、工具三个维度帮助企业数据团队完成端到端的数据科学项目部署。 《数据科学实战指南》内容包括数据科学项目的基础概念、准备工作、团队人才及端到端的实战案例等,适合正面临数字化转型的企业决策者、数据团队负责人,以及从事数据科学工作的数据分析师、数据科学家、数据工程师等阅读。

决策与我们的生活和工作息息相关。改变人们命运的并不只是努力。比努力更重要的是决策。正是过去的一系列决策,决定了我们的现状;目前正在做和即将做的决策,注定将影响我们的未来。

数据挖掘原理与SPSS Clementine应用宝典(含光盘1张)(试读本)
从数据挖掘原理与SPSS Clementine实践,层层深技术内幕。 本书面兼顾,目录分类细致而科学,方便快速查阅。 配套代码和精美PowerPoint幻灯片课件。 本书从数据挖掘基础、数据挖掘经典算法、数据挖掘业务建模与模型评价、SPSS Clementine数据挖掘实务这4方面对数据挖掘技术行了全面介绍。本书既有数据挖掘理论知识、又有SPSS Clementine数据挖掘实战,注重从理论到实践。 本书可作为高等院校计算机科学与技术专业、软件工程专业或信息类等相关专业的教材,也可作为有关数据挖掘技术方面的培养教材,以及所有拟从事数据挖掘领域研究的学生、学者和工程师的参考用书。

1.贴近实战场景 深度剖析企业级实时运营指标项目案例,快速掌握实战发经验。 2.掌握实战技术 详细解读Scala 函数式编程,SparkCore、Spark SQL、Spark Streaming 关键原理。 3.附赠丰富资源 随书附赠实例源代码、ppt和数据资源,方便读者学习。

一部适合检测检验机构日常检验检测工作的实用参考书。

1.畅销经典教材配套用书,贴近全国计算机等级二级考证需求。 2.采用主流数据库版本2016,配有自测习题和模拟试卷。 3.配有微课,指导学生边学边练。 4.步骤讲解细致,操作实用性强。

1. 新版本,受众广泛。本书采用新的IBM SPSS 26.0版本,从SPSS简介、数据管理、基本统计分析到高级统计分析逐渐深,适合各个层次读者阅读和学习。 2. 理论与实践相结合。介绍统计理论及SPSS分析模块,加大量SPSS实际应用案例与行业应用方案,引导读者掌握SPSS软件及技术原理,熟练使用统计方法和软件操作解决实际工作问题。 3. 配置微课,资源丰富。本书配有微课视频,并提供PPT课件、教学大纲、电子教案、数据源文件、课后习题答案、模拟试卷及答案等教学资源。

新增了大量实战案例的分析和讲解,并精选书中的部分案例由作者制作成视频教学资料(DVD光盘)随书附赠。



你了解NFT吗?NFT究竟是什么?NFT为什么有这么大的魔力吸引这么多人的投?未来NFT将扮演什么样的角色?NFT的未来趋势是什么? 本书全面、体系化地介绍NFT的概念与特、技术栈和生态,分析NFT在未来世界(包括元宇宙、Web3.0等)中的地位及前景,并深探讨NFT的应用场景,帮助你了解NFT的发展脉络,理解NFT的底层技术逻辑,掌握NFT的设计原则,从而梳理出对NFT的全景认知。 通过阅读本书,你将了解: **NFT的概念与发展; **NFT的创建与流通; **NFT与数字艺术; **NFT的技术栈; **NFT的诸多应用; **NFT的产业与生态; **NFT与数字经济; **NFT的风险与监管; **NFT的未来趋势。

《数据科学技术:文本分析和知识图谱》是一本深浅出的数据科学技术指南。书中详细介绍了文本分析和知识图谱等关键技术,结合典型案例展示了数据科学在安全、应急等行业的应用实践。无论你是数据科学领域的专业人士还是对数据科学感兴趣的读者,这本书都能帮助你深了解数据科学的基本概念、方法和最新技术。通过学习《数据科学技术:文本分析和知识图谱》,你将能够掌握数据科学的核心知识,为自己的职业发展和创新项目提供有力支持。

《数据分析实践:专业知识和职场技巧》适合初级、中级数据分析师阅读,也适合在工作中需要应用数据分析解决问题的职场人参考。

面向高等职业院校学生,注重素质教育和就业技能提升。内容简明、结构严谨、创新。 结合理论与实践,培养专业技能和实践能力。使用任务驱动、案例教学等方法,激发学生兴趣,促主动学习。 编写团队由经验丰富的一线教师和网络工程师组成。

本书内容一共包括八章,分布在目标、原理、技术、业务4个主要层级板块。依据这4个层级的递关系,完成了从数据科学到数字经济的总体价值实现路转换。本书内容适用于广大对数据科学感兴趣的技术从业人员,帮助技术人员更好地突破 懂技术,但不落地 的痛,让读者在掌握核心大数据技术的同时,找准数字产业的应用方向,通过数字化创新的业务场景实现技术价值发挥。

1.R语言多元统计分析在医学领域的应用指南,结合精选的医学实例,帮助读者熟练使用R语言及相关包实现多元统计计算,并且更深地理解多元数据分析方法。 2.作者赵军副教授在流行病学、医学统计学和数据科学领域拥有超过15年的教学和科研工作经验是国内多家医院的统计分析咨询与服务专家。 3.强调实战和应用,使用R语言介绍常用的多元统计分析方法,不仅介绍理论知识,还提供了大量的应用案例和代码,帮助读者更好地理解和应用所学知识。 4.本书可作为医学院校高年级本科生或研究生的多元统计分析课程教材,也可作为其他专业读者和科研工作者从事科研活动的参考资料。 5.资源丰富:全书附有代码和数据集,习题参考答案等资源,可供读者随时查阅和参考。

Excel与Power BI数据分析及可视化标准教程(实战微课版)
从零始,循序渐:详细介绍数据分析及可视化相关的基础知识和应用 紧贴实际,案例导航:全书配备121个动手练,对重要知识随学随练 全程图解,快速上手:知识和案例采用全程图解方式 微课辅导,易学易用:全书重要知识和动手练配视频讲解

(1)知识讲解宜读易懂,语言表述顺畅自然。 讲述大数据技术中通用的基础知识,为读者一步研究理论和应用技术下坚实的基础。基本概念清晰、准确、精练,语言表述顺畅、宜读、自然,尽量避免使用晦涩难懂的语言描述深奥的理论和技术知识。 (2)系统构建知识体系,培养读者的大数据思维。 建立恰当的知识体系,并把相关知识行合理组织,而不是杂乱无章地堆砌。注重大数据技术的科学分析,有利于培养读者的大数据思维。 (3)理论与实践相结合,注重培养实战型人才。 针对大数据技术的相关应用,通过对典型实例行分析,读者能够深且全面地理解并掌握大数据技术的具体应用方法,而提高自身独立分析问题和解决问题的能力。 (4)配套丰富教辅资源,立体化服务高校人才培养。 为了更好地服务院校教学,助力大数据领域工程型人才培养,编者为本

内容丰富:本书全面覆盖了TDengine的基础知识、运维管理、应用发到技术内幕,为读者提供一站式学习资源。 紧贴前沿领域:书中不仅介绍了TDengine的核心概念和功能,还深探讨了时序数据处理的最新趋势和技术创新,保持了内容的前沿性。 深浅出:本书以通俗易懂的语言解释复杂概念,通过逐步引导的方式,使读者能够轻松理解并掌握TDengine的高级特性。 理论与实践相结合:通过大量的实例演示和实践案例,本书将理论与实际应用紧密结合,帮助读者更好地将知识应用于具体场景。 TDengine官方出品:本书由TDengine官方具有丰富实战经验的行业专家撰写,确保了内容的专业性和权威性,为读者提供了可靠的学习指导。

1.有效:提供一套有效处理抽象商业问题的计算框架,包含市场环境分析、营销模式分析、商业模式设计、供应管理分析等内容。 2.全面:从战略设计贯穿到日常业务运营细节,适合分析人员构建经营分析框架,也适合业务人员提升商业分析能力,更适合管理人员提升企业经营效率。 3.真实:本书所有案例和产品都是真实存在的,所有环节都是企业真实的运营环节,在工具和方法上具有很强的迁移性,也适合作为企业构建商业分析框架的标准样板。 4.专业:作者既是商业分析专家,也是业务专家,本书方法论经过网易、阿里巴巴的项目实践认证。白慧源、孙志岗、杨非、毛屹宏、袁俊杰等人鼎力推荐。

探索五大数据挖掘竞赛场景,掌握解题策略和流程,将理论与实践完美融合。深度解读TOP方案,重现其卓越代码,助力您在竞赛中脱颖而出,提升数据挖掘技能,为实际业务注更高效能的模型力量。