
原版图书多年畅销,并改正第2版的错误,具有以下特: ① 直观易懂性。 ② 先性。 ③ 实用性。 ④ 结构清晰,讲解详尽。 ⑤ 全部的案例数据、程序与多媒体示范相结合。


本书从大数据架构的角度全面解析大数据技术及算法,探讨大数据的发展和趋势,全面介绍大数据的相关技术、算法和应用场景,帮助读者培养大数据的技术选型和系统架构能力。

Selenium WebDriver 3 实战宝典(Java版)

在本书第1版的基础上,按照离线大数据和流式大数据两个场景行划分 在代码实现上以Python为主,紧贴主流编程语言 代码的可用性增强


数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考EMC Proven Professional数据科学家认证。EEMC专家认证是IT行业领先的教育和认证项目,涵盖了信息存储技术、虚拟化技术、云计算、数据科学与大数据分析等领域。通过认证是一种很好的自我投资方式,同时也是对自己专业知识的正式验证。本书可以作为准备数据科学专员(EMCDSA)认证的资料。在驱动企业和服务提供商转型


《从1始 数据分析师成长之路》从简单的制作报表始和大家一起学习数据分析的五大模块:报表BI系统、异常数据分析、解决数据需求、项目性数据分析以及数据建模,为大家全方位、体系化地呈现数据分析到底是什么。

数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面
讲解过程图文并茂,读者学习时更加轻松; 讲解详细,并安排了项目实例,使读者能够边学边练,在短时间内就可以有一个较大的提高。采用由浅深、简单实用的形式,方便读者快速掌握可视化软件的基本操作,并通过系统的案例使读者迅速掌握应用技巧。

《*、天猫电商数据分析与挖掘实战(第2版)》第1版获得了很多读者的认可,甚至有不少高校将其改编成了教程,但《*、天猫电商数据分析与挖掘实战(第2版)》依旧有许多不足之处,比如对于运营模块内容较少而且不够深,特别是数据挖掘套件的安装和部署难倒了许多读者。 《*、天猫电商数据分析与挖掘实战(第2版)》第2版为了跟上时代的变化和解决软件部署烦琐的问题,首先将线下的数据平台改成新平台,或是用其他平台替代;其次是对于软件方面的升级,将 SQL Server 的挖掘套件换成了SmartMining 个人版,部分章节使用了 Excel 2016 版本,用 Power Pivot 实现数据建模,用PowerQuery 提升数据清洗的能力。

以商业数据分析为主线,立足互联网工作现实。从如何获取数据到如何在实际工作场景中分析数据,*后以如何完美呈现数据分析的结果为结尾。帮助读者从零阶,玩转商业数据分析。

★ 本书是全面搭建数据运营体系 首著 ★ 是更适合国内企业的数据运营实践方法论 ★ 可协助企业在数据运营的道路上少走弯路 ★ 其中有工具和方法,还有大量实战案例 ★ 更有作者15年相关从业经验的总结 ★ 便于读者快速上手具体的运营问题 ★ 书中的知识和见解可以复用于很多企业 ★ 这是一本多年数据运营实战的总结之作 ★ 也是一本搭建数据运营体系的指导之作 ★ 可以说是整个数据行业的 宝贵财富 ★ 不同的读者都将从本书中获益匪浅 ★ 初数据行业的大学毕业生可找到快速上手的方法 ★ 行五年到八年左右的资深人士可收获更丰富的行业案例 ★ 企业管理者可了解数据运营如何为业务创造价值,以及如何从0到1搭建和管理数据团队


数学菜鸟也能搞懂数据分析! 从零学起:没有深奥的理论和晦涩的知识 实际体验:免费软件RStudio 提供模拟数据 应用R语言轻松学统计: 平均值/直方图/t检验/卡方检验/相关/回归分析/逻辑回归分析/文本挖掘 商家的抽奖促销有猫腻? 面包店的面包缺金少两? 调查问卷的结果该怎么分析? 曾经的热销商品为什么不好卖了? 网络上的匿名中伤者找得出来吗? 坏事的发生是否能预测? 让数据告诉你答案!

这是一个“数据为王”的时代,数据驱动“工业4.0”、“互联网+”、“中国制造2025”滚滚前行;数据是企业沉睡的资产,是生生不息的宝藏;只有去认识、去发掘,大数据才能体现巨大的业务价值。

1.云计算专家,同济大学教授力作 2.华为公司提供真实企业发案例 3.提供典型源软件实训与案例 4.突出云计算系统内容,包括分布式计算、云计算架构、虚拟化技术及行业应用等 5.配套数字课程资源实训平台,并提供多媒体课件、案例代码等丰富的配套资源

本书围绕股票挖掘,所构建的知识体系非常全面完善。在技术上,不仅包含了数据挖掘中常见的方法,如匹配方法、关联分析、分类、聚类、预测、时间序列分析等,还包括自然语言处理方法、深度学习方法、舆情分析方法、行为金融学心理学等方法。在数据应用上,不仅包含了对场内每笔成交数据的分析,还包括财务数据、新闻数据、股吧论坛、机构研报、用户行为等方面的分析。

数据架构师无疑是计算机技术领域金字塔***的职位,技术门槛高,市场需求也旺盛,人才缺口很大,成熟的数据架构师**是人才市场上被疯抢的紧俏人才;而近年兴起的商业智能技术,其相关人才也是被广大HR青睐的对象。本书兼顾了计算机技术领域当前*热门的两种技术,作者在一线从业多年,给多个世界500强企业的IT系统做顶层设计,本书总结了作者这些年数据架构设计和商业智能实现的心得和技巧,特别适合那些希望提升自身价值的IT工作者和希望有更好就业前景的相关专业学生学习。 相关图书推荐 商业智能深浅出——Cognos,Informatica技术与应用 完美软件发:方法与逻辑 软件研发成本度量规范释义 Java代码与架构之完美优化 实战经典 SAP商务智能实用发与高级功能详解




本书帮你从看流量到看懂流量,从看数据到看懂数据,从了解访客的浏览行为到理解用户的搜索请求。


本书是 大数据王 的个人专著。大数据时代是充满无限生机的时代,也是一切都有可能的时代。本书为人们提供了 柴郡猫 智慧的小样本。

1.权威内容尝鲜。早鸟5G趋势类图书,侧重趋势而非技术,腾讯内部数据支撑,经得起推敲。 2.流量*的作者。腾讯安全战略研究中心官方出品。作者翟尤为得到讲师、知乎live 5G同名课程讲师,人次过2万。谢呼为腾讯副总裁 3.权威人士推荐。工程院院士邬贺铨推荐 4.权威会议推荐。世界5G大会推荐图书 5.权威数据支撑。大融合领域、40个实际案例、51条重知识、55次深度分析、121个关键定义、162组新数据









Java微服务测试:基于Arquillian、Hoverfly、AssertJ、JUnit、Selenium与Mocki
微服务面临不可预知负载,分布式设计带来安全性能隐患,异步通信容器让挑战加剧。 内容涵盖自动化测试微服务系统集成测试以容器为中心的系统测试服务虚拟化 基于JVM微服务实现单元集成测试,实践高级混沌测试集成测试契约测试 ArquillianTomEE主创人员执笔,重磅企业场景测试实战力作首度问世 一切从用Java EEWildFly SwarmDocker来搭建微服务环境起步

1、赵刚博士在信息化领域耕耘10余年,对大数据的认识深刻且系统。 2、阐述的视角放在了大数据的技术应用上,对于想利用大数据的读者非常具有参考价值。 3、结合应用实践,详细阐述了传统信息系统与大数据平台的整合策略,大数据应用实践的流程和方法,并介绍了主要的大数据应用产品和解决方案。 海报

Alluxio创始人及实践先驱联合力荐 深度解密Alluxio核心概念与技术应用 基于国内一线互联网企业真实案例技术剖析 项目PMC Maintainer凝聚钻研实力与超前视野



数据新闻只是新闻报道中的一种形式,弥补传统新闻或叙事性新闻无法呈现的效果。数据新闻 采用可视化的方法将单调的数据用一种直观、便于理解和更具说服力的方法呈献给读者。数据,特别是大量的数据比采访几十个对象获取的抽样信息做出的结论更客观、更容易阐明观。

作者携手数据领域的强大智囊团为读者贡献的一本处理噪音数据的指南。本书囊括众多真实世界的应用案例以及高水平的方法和策略。本书汇集国外数据社区的技术骨干和活跃分子的集体智慧,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。噪音数据就是那些"给你惹麻烦的数据",从蹩脚的存储到糟糕的说明,再到令人误解的策略,有多重情况可能导致噪音数据。那么什么才是决定性因素呢?有人认为是技术方面的问题,比如缺失值或格式不对的记录,但是噪音数据包含更多的问题。本书介绍了多种有效的方式来应对噪音数据。在本书中,多位数据领域的专家共同揭示了如何处理棘手的数据问题的奥秘。通过阅读本书,你将学会:测试你的数据,判断它是否适合分析;将电子表格数据转变成可用的格式;处理潜藏在文本数据里的编码问题;行一种

本书是完全来自于实践的Modeler数据分析与挖掘的实战型著作; 全书通过15个行业应用案例,介绍Modeler在数据分析与挖掘领域中的应用; 本书是作者在行业工作中的经验分享,因此所涉及到的案例具体很强的实用性,可以用来解决你在商业应用中的实际问题。

本书是MathWorks图书计划作品。本书凝聚了薛定宇教授30年的MATLAB科研与教学积淀、30年的MATLAB推广与普及经历!其授课视频在爱课程与中国慕课数拥有十万读者学习的视频课程!英文版全球同步发行! 视频公课: 爱课程或中国大学MOOC(慕课) 现代科学运算 MATLAB语言与应用 控制系统仿真与CAD (非严格配套本书视频,仅供读者参考)。 配书源代码: 配书源代码可以到清华大学出版社网站本书页面下载。 薛定宇大讲堂系列图书将陆续出版: 薛定宇教授大讲堂(卷Ⅰ):MATLAB程序设计 薛定宇教授大讲堂(卷Ⅱ):MATLAB微积分运算 薛定宇教授大讲堂(卷Ⅲ):MATLAB线性代数运算 薛定宇教授大讲堂(卷Ⅳ):MATLAB*化计算 薛定宇教授大讲堂(卷Ⅴ):MATLAB微分方程求解 薛定宇教授大讲堂(卷Ⅵ):MATLAB/Simulink仿真

5大统计学专业方向/65个统计学知识/50个经典的统计学案例 教会你如何说服别人Believe in the power of data(相信数据的力量)



揭秘网站运营本质和策略解析数据驱动运营的奥秘多行业经典案列深剖析分享真实的网站运营技巧


本书以介绍思路为主, 通过丰富的案例讲解爬取数据的思路, 介绍数据分析、可视化的方法, 以及如何根据数据分析结果,发一个应用, 为读者提供一个从采集数据到应用数据的完整视角。

数据产品设计快速门指南 详细介绍数据产品设计流程

1.原创性:特异群组挖掘是作者原创的概念,是原创的新型数据挖掘任务和解决方法。 2.受众广泛性:特异群组挖掘是一种有多种应用场景的数据挖掘技术,涉及读者面广泛。 3.权威性:本书作者朱扬勇教授在数据挖掘领域已经研究了30多年,是国际数据科学研究的主要倡导者之一。经上海市科学技术委员会批准,代领团队建设了上海市数据科学重实验室,该实验室是全国*早研究数据科学和大数据的科研机构之一,也是首个政府支持的数据科学科研机构,积累了大量的数据和数据挖掘的经验。此外,朱扬勇教授与多地政府合作,并担任2018年在福州举办的 首届数字中国建设峰会 顾问专家,2019年重庆智博会顾问专家等职务。基于作者团队雄厚的知识储备,本书兼具新颖性和权威性。


大规模在线应用、企业级基础服务、以及各种新型应用促使诞生了十万级甚至百万级服务器的大型数据中心。云计算、物联网、大数据等新型计算和应用推动了现代数据中心的快速发展,并使其成为国家和IT企业的核心信息基础设施。数据中心网络不仅是连接大规模服务器的桥梁,而且是承载网络化存储和网络化计算的基础,其网络互连结构的设计是影响网络性能的首要因素。现代数据中心的内部流量已从传统的 南北流量 为主演变为 东西流量 为主,导致数据中心的网络性能成为瓶颈,传统的树型互连结构已经不能满足新的需求。 近年来,研究人员从不同角度提出了很多新型数据中心网络互连结构,力求满足高带宽、高容错、高可扩展性和低成本的需求。虽然新型互联结构的研究不断提高数据中心的网络传输能力,但是对数据中心现有传输能力的高效利用同样重要

系统论述云存储安全的基础知识与关键技术!深解读大数据的知识基础!业内知名专家联袂推荐! 本书从云存储安全体系结构出发,介绍了云存储虚拟化安全、云存储系统身份认证与访问控制、加密云存储系统、密文云存储信息检索、云存储服务的数据完整性审计、云存储数据备份与恢复,大数据时代的云存储安全,为相关专业的学生与研究人员提供了极好的参考资料。

知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及*终可理解的模式的非平凡过程。

通俗地阐述了什么是云,什么是大数据,云与大数据有什么关系;介绍了相关的各项技术,以及在商业中怎样应用大数据。 本书系统性强,表述清晰,能将概念阐释和技术应用很好地融合。

大数据之美:挖掘,Hadoop,架构,更精准地发现业务与营销
本书以基本概念和发展现状作为切,对多种大数据关键技术行逻辑性阐述和分析,同时结合典型应用领域,论述了大数据技术在通信、互联网中扮演的重要角色,系统地向读者阐述了大数据的内涵。


