【课程收益】
【课程特色】
1. 课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。
2. 清晰的知识结构,根据应用经验采用最优化授课模式。
3. 内容充沛、详略得当,前后呼应。
4. 讲师资历丰富,具有丰富的实践经验。
5. 知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪
【课程对象】相关人员
【课程时长】2天(6小时/天)
【课程大纲】
第一部分:数据仓库
第二部分:数据存储方案
第三部分 数据处理过程的规划、设计、优化
时间 | 内容 | 案例实践与练习 |
一、大数据时代背景 二、大数据业务应用场景 三、大数据在各行业最佳实践案例 | 案例讨论:大数据行业应用价值 | |
一、大数据处理技术发展趋势 二、大数据主要存储技术介绍 三、大数据主要计算技术介绍 | 案例分析: 大数据与传统存储计算技术的关系
|
课程2:大数据基础理论与算法入门
时间 | 内容 |
第1个主题:概率论与数理统计入门
| |
第2个主题:离散值的概率分布
课堂实操:概率统计各种相关类型习题讲解,由浅入深探索概率统计 第3个主题:SQL语法与应用实战
| |
第4个主题:数据预处理
第5个主题:数据分析入门
| |
第6个主题:数据算法基础
| |
第7个主题:数据算法基础
|
课程3:Hadoop生态系统
时间 | 内容 | 案例实践与练习 |
一、HDFS特征及读写文件 二、NameNode的考虑 三、HDFS安全概览 | 案例练习:HDFS基础命令 | |
一、运用 Hadoop文件Shell 二、利用Flume 从外部源摄取数据 三、利用Sqoop从关系数据库摄取数据 | 案例练习:HDFS脚本及接口命令 | |
一、MapReduce原理及特征 二、YARN2.0架构与原理 三、Zookeeper和YARN2.0关系 | 案例练习:MapReduce运行及调度 | |
一、SQOOP原理及特征 二、SQOOP开发应用 三、SQOOP和Hadoop关系 | 案例练习:SQOOP开发 | |
一、zookeeper原理及特征 二、zookeeper架构与应用 三、Zookeeper和Hadoop关系 | 案例练习:Zookeeper集群管理命令 | |
一、HBase原理及特征 二、HBase and RDBMS 三、HBase Shell | 案例练习:HBase Shell命令 | |
一、创建表 二、HBase 的ROWKEY设计 三、Hbase的优化设计 | 案例练习:HBase 优化设计 | |
一、Hive模式和数据存储 二、Hive与传统数据库的比较 三、Hive应用案例 | 案例练习:Hive模式及管理命令 | |
一、HQL基础DDL编程 二、HQL基础DML编程 三、HQL实现关联操作 | 案例练习:Hive 基础开发 | |
一、Hive管理的各中表与模型应用 二、装载数据进入Hive 三、Hive维度模型开发应用 | 案例练习:Hive模型开发 | |
一、Flume装载数据进入Hive 二、SQOOP装载数据进入Hive 三、Hive开发与Hadoop关系 | 案例练习:Hive接口开发 | |
一、Scala基础知识 二、Scala常用集合 三、Scala应用场景 | 案例练习:Scala基础开发 | |
一、函数对象 二、编程实例 三、Scala高级开发应用 | 案例练习:Scala开发应用 |
课程4:Spark生态系统
时间 | 内容 | 案例实践与练习 |
一、Spark发展历史及简介 二、Spark业务应用场景 三、Spark与Hadoop系统关系 | 案例讨论:Spark与Hadoop系统关系 | |
一、Spark原理及特征 二、Spark架构及组件应用场景 三、Spark接口及应用场景 | 案例讨论:Spark接口及应用场景 | |
一、RDD基础 二、转换操作与执行操作 三、共享变量 | 案例练习:RDD基础开发操作 | |
一、Spark计算框架原理及特征 二、Spark架构与应用 三、Spark之宽窄依赖和DAG调度 | 案例练习:Spark计算模型及运行日志查看 | |
一、Spark资源调度原理及特征 二、Spark资源调度架构及应用 三、Spark资源调度基于Hadoop | 案例练习:Spark调度命令 | |
一、Spark生态系统接口介绍 二、Spark生态系统接口与Hadoop 三、Spark生态系统接口与大数据分析 | 案例练习:Spark接口开发 | |
一、Spark SQL原理与架构 二、Hive SQL与Spark SQL 三、Spark SQL开发应用 | 案例练习:Spark SQL基础开发 | |
一、Spark SQL与Hive 二、Spark SQL与模型构建 三、Spark SQL与数据挖掘分析 | 案例练习:Spark SQL模型开发 | |
一、Spark Streaming基本原理 二、Spark Streaming开发基础 三、Spark Streaming开发应用 | 案例练习:Spark Streaming开发 | |
一、Spark ML读取数据 二、Spark ML对数据进行探索 三、Spark ML训练模型 | 案例练习:Spark Mllib开发 | |
一、Spark ML组装任务 二、Spark ML评估、优化模型 三、Spark Mllib开发 | 案例练习:Spark Mllib开发 | |
一、Spark GraphX 的核心代码剖析 二、Spark GraphX 命令方式操作 三、Spark GraphX 的客户端 API 介绍 | 案例练习:Spark Graphx开发 |
课程5:大数据流式处理技术入门
时间 | 内容 | 案例实践与练习 |
一、大数据流式处理技术原理与架构 二、大数据实时计算应用场景 三、大数据实时计算与Hadoop系统 | 案例讨论:大数据实时计算与Hadoop系统 | |
一、大数据流式处理组件介绍 二、SparkStreaming与各流计算组件特点 三、大数据流式处理技术选型实践 | 案例讨论:大数据流式处理技术选型 | |
一、FLUME基本原理 二、FLUME架构部署 三、FLUME管理运维开发命令 | 案例练习:FLUME开发基础 | |
一、FLUME读取数据 二、FLUME处理数据 三、FLUME写入数据 | 案例练习:FLUME开发应用 | |
一、Kafka基本原理 二、Kafka架构部署 三、Kafka管理运维开发命令 | 案例练习:Kafka开发基础 | |
一、Kafka读取数据 二、Kafka处理数据 三、Kafka写入数据 | 案例练习:Kafka开发应用 | |
一、ELK各组件特点 二、ELK架构优势 三、ELK开发应用场景 | 案例练习:ELK开发基础 | |
一、ELK部署配置 二、ELK管理运维 三、ELK开发应用 | 案例练习:ELK开发应用 | |
一、Flink原理 二、Flink架构优势 三、Flink开发应用场景 | 案例练习:Flink开发基础 | |
一、Flink部署配置 二、Flink管理运维 三、Flink开发应用 | 案例练习:Flink开发应用 |