数据清洗是大数据技术不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,把 脏 的数据变为 干净 的数据。本书详细讲解了ETL技术方法和常用工具、常用的数据清洗工具、数据抽取、数据转换与加载、对Web数据的采集、对RDBMS数据的清洗操作。目前市面上此类书还很少,对数据清洗从业人员是一本不可多得的技术参考书,也可以作为应用型院校的课程教材。
¥39.70定价:¥58.00 (6.85折)
大数据导论 本书详细介绍了大数据相关概念,大数据在各个行业的应用,重点介绍了大数据相关技术及其应用。
本书作者为大数据专业一线教师。本书首先详细介绍了大数据相关概念,接着介绍了大数据相关技术及其应用,*后介绍了大数据在各个行业的应用。在了解大数据的相关概念后,对大数据行业需要用到哪些技术有详细的了解,每种技术都给出了相应的运用工具,读者可以使用相应的工具来验证对应的技术;*后介绍的行业运用让读者对大数据在各个各业中起到的作用有深入的了解。本书侧重理论和实践的结合。
¥42.80定价:¥58.00 (7.38折)
大数据系统运维 金融系统资深专家主编,从基础理论到运维实践,重点介绍了大数据系统的运维特点及运维技能。
作者具有丰富的一线经验。重点介绍了大数据系统的运维特点及运维技能。本书从运维工作的分类出发,对每种运维工作都进行了由浅入深的介绍。配置管理是整个运维工作的基础和核心,没有配置管理,就如同在复杂的城市道路中行走没有了地图,随时可能迷失方向;同时,在配置管理章节介绍大数据技术的运维管理工具,掌握这些工具能有效地提高工作效率。系统管理,故障管理,变更管理和升级管理是基础性的,也是日常性的运维工作;安全管理,性能管理,服务资源管理和高可用管理则在运维工作中相对比较高阶,也是比较复杂的内容;且系统运维注重强调标准、流程和制度。本书侧重理论和实践的结合。
¥35.40定价:¥48.00 (7.38折)
本书介绍了目前大数据处理的两套主流框架Hadoop和Spark,包括Hadoop分布式文件系统、MapReduce计算框架、HBase数据库、Hive结构化数据处理模块、Spark计算框架和Spark SQL 结构化数据处理模块。书中按照顺序由浅入深地介绍了各模块的系统原理、部署方法、配置方法、基本操作等内容。本书侧重于实践操作,通过实践学习大数据技术,在使用大数据工具的过程中使读者逐步了解大数据处理的基本概念、方法和步骤,强化实际操作能力。可以作为大数据初学者的自学教材和参考手册。
¥42.80定价:¥58.00 (7.38折)
本书讲述了数据挖掘概念,数据挖掘的常用算法,包括分类方法、聚类方法和关联规则方法。本书注重实战,给出了综合实战方法和在不同行业的应用案例。
¥32.90定价:¥48.00 (6.86折)
计算机与信息技术应用基础 刘旸,高文来,张燕 主编 石油工业出版社,【正版可开发票】 全国三仓发货,物流便捷,下单秒杀,欢迎选购!
¥32.00定价:¥71.37 (4.49折)
导语_点评_推荐词
¥31.80定价:¥45.00 (7.07折) 电子书:¥22.50
计算机图形学(全国高等院校应用型创新规划教材)/计算机系列 团购优惠,咨询在线客服
¥37.17定价:¥49.00 (7.59折)
明星店铺 博库网旗舰店
¥36.51定价:¥49.00 (7.46折)
R语言 本书分为基础篇、应用篇和进阶篇。注重实践;注重数据变成价值;注重大数据的分析。
该书深入浅出地介绍 R 语言在大数据分析应用中的相关知识及编程。 基础篇:讨论数据处理的R环境,包括R数据结构(数据框、列表等)、数据导入/导出、数据清洗(处理数据的缺失值、不一致、异常值)、数据变换(汇总、集成、透视表、规约等)、可视化、高级语言编程、数据分析常用建模方法和原理,涵盖了目前数据挖掘的主要算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式,利用可视化数据挖掘包Rattle进行试验指导。 应用篇:讨论2个经典的数据分析报告案例,通过案例分析使读者能够把学到的R基础知识应用到解决实际问题中,把数据变成价值。 进阶篇:解决R语言在处理大数据时性能低下的问题,讨论了两个R包:RHadoop、SparkR。
¥44.10定价:¥59.80 (7.38折) 电子书:¥23.32
¥36.44定价:¥49.00 (7.44折)
¥36.26定价:¥49.00 (7.4折)
明星店铺 木垛图书旗舰店
¥35.64定价:¥52.00 (6.86折)
¥30.60定价:¥68.00 (4.5折)
¥30.87定价:¥68.00 (4.54折)