当前位置:首页 > 图书中心 > 教材 > 高职教材 > 大数据技术原理与操作应用
大数据技术原理与操作应用
ISBN:978-7-5689-2357-6
高职高专计算机系列教材
作者:王倩 阎红
策划编辑:曾显跃 范琪
编辑:曾显跃
字数(千):438 页数:263 印次:1-1
开本:16开  平装
出版时间: 2020-08-20
定价:¥48
内容简介

本书围绕Hadoop生态圈相关组件系统介绍大数据架构。全书共10章,其中,第1、2章主要介绍Hadoop的概述以及如何搭建Hadoop的集群;第3章~第5章介绍分布式文件系统(HDFS)、分布式计算框架(MapReduce)以及分布式协调服务;第6章介绍Hadoop 2.0新特性,包含YARN和高可用集群的原理。第7章~第9章主要介绍Hadoop生态圈的相关辅助系统,包含Hive、Flume、Sqoop;第10章是综合案例的开发,利用Hadoop的相关组件进行项目的开发,同时加深对Hadoop生态圈的技术的理解。
本书可以作为高职高专计算机相关专业、信息系统相关专业、数据科学相关专业的大数据平台课程教材,也可供一线技术人员参考。

目录
第1章初识Hadoop
1.1大数据的介绍
1.2Hadoop的介绍
习题1

第2章Hadoop集群构建
2.1Linux系统安装
2.2Linux系统网络配置
2.3创建普通用户
2.4构建Hadoop完全分布式集群环境
2.5Hadoop平台运行及测试
习题2

第3章HDFS分布式文件系统
3.1Hadoop的文件系统
3.2HDFS的简介
3.3HDFS的架构及原理
3.4HDFS的Shell操作
3.5HDFS的Java API操作
习题3

第4章MapReduce分布式计算系统
4.1MapReduce的介绍
4.2MapReduce运行机制
4.3案例:使用MapReduce实现反向索引
习题4

第5章ZooKeeper分布式协调服务
5.1认识ZooKeeper
5.2ZooKeeper的数据模型
5.3ZooKeeper的Watch机制
5.4ZooKeeper的选举机制
5.5ZooKeeper分布式集群部署
5.6ZooKeeper的Shell操作
5.7ZooKeeper Java API操作
5.8ZooKeeper 应用场景
习题5

第6章Hadoop 2.0新特性
6.1Hadoop 2.0的改进与提升
6.2YARN体系结构
6.3YARN工作流程
6.4HDFS HA的搭建方法
习题6

第7章Hive数据仓库
7.1Hive的介绍
7.2Hive的安装部署
7.3Hive的基本操作
习题7

第8章日志采集系统
8.1Flume的介绍
8.2Flume基本使用方法
8.3Flume采集方案配置说明
8.4Flume的可靠性保证
8.5Flume拦截器
8.6案例——日志采集
习题8

第9章Sqoop数据迁移
9.1Sqoop的介绍
9.2Sqoop数据导入
9.3Sqoop数据导出
习题9

第10章综合项目案例
10.1最高气温统计案例
10.2电子商务离线数据统计案例

参考文献