炼数成金—Spark大数据平台视频教程 炼数成金大数据学习视频教程


资源介绍

目前网上完整的只有前七课,先发布出来给大家,后续如有更新会第一时间更新,也欢迎大家来补充


——————-课程目录——————-


1:Spark生态和安装部署
2:Spark运行架构和解析
3:Spark的监控和调优
4:Spark编程模型和解析
5:Spark的多语言编程
6:Spark Streaming原理和实践
7:Spark SQL原理和实践
8:Spark源码研读
9:Spark 机器学习入门
10:GraphX 入门
11:杂谈

1:Spark生态和安装部署
Spark生态
  Spark(内存计算框架)
  SparkSteaming(流式计算框架)
  Spark SQL(ad-hoc)
  Mllib(Machine Learning)
  GraphX(bagel将被取代)
安装部署
  Spark安装简介
  Spark的源码编译
  Spark Standalone安装
  Spark Standalone HA安装
  Spark应用程序部署工具spark-submit

2:Spark运行架构和解析
Spark的运行架构
  基本术语
  运行架构
  Spark on Standalone运行过程
  Spark on YARN 运行过程
Spark运行实例解析
  Spark on Standalone实例解析
  Spark on YARN实例解析

3:Spark的监控和调优
Spark的监控
  Spark UI监控
  Ganglia 监控
Spark调优

4:Spark编程模型和解析
Spark的编程模型
  Spark编程模型解析
  RDD的特点、操作、依赖关系
  Spark应用程序的配置
Spark编程实例解析
  日志的处理
  电信基站数据的处理

5:Spark的多语言编程
Spark的scala编程
  Scala基本语法
  Scala开发环境搭建
  Scala开发Spark应用程序
Spark的python编程
  Python的基本语法
  Pyhton开发Spark应用程序

6:Spark Streaming原理和实践
Spark Streaming原理
  Spark流式处理架构
  DStream的特点
  Dstream的操作和RDD的区别
  Spark Streaming的优化
Spark Streaming实例
  文本实例
  Window操作
  网络数据处理

7:Spark SQL原理和实践
Spark SQL原理
  Spark SQL的Catalyst优化器
  Spark SQL内核
  Spark SQL和Hive
Spark SQL的实例和编程
  Spark SQL的实例操作demo
  Spark SQL的编程

8:Spark源码研读
Spark源码研读
  Spark源码下载和研读环境搭建
Spark Core介绍
  SparkContext
  Executor
  Deploy
  RDD和Storage
  Scheduler和Task
Spark Examples介绍

9:Spark 机器学习入门
机器学习的原理
Mllib简介
Mllib的例程分析

10:GraphX 入门
图论基础
GraphX的简介
GraphX例程分析

11:杂谈
基于Spark的衍生项目
  BlinkDB
  RSpark
Spark和MapReduce、Tez
Spark和Techyon
Spark的优秀网站、书籍、牛人介绍