沈阳大数据培训中心

上课方式：直播,面授

班级类型：小班

上课时段：白天班,晚班

价格：￥询价

预约试听在线咨询

沈阳大数据培训中心课程详情

大数据是各国抢占新一轮经济和科技发展制高点的战略选择，实力技术人才遭到企业疯抢，学习大数据，就业口径宽广，"钱途"无量！通过构建在实时数仓之上的用户画像和推荐系统将数据与算法融合，学员真正完成企业级大数据应用学习。重新定义大数据高级培训，开启大数据架构师进阶之路。

为什么要选择大数据行业？

有政策支持

行业前景广

人才缺口大

平均月薪高

核心教学优势，专为提升设计

专业教研团队

为提高课程前瞻先导性，及与企业无缝对接，对市场进行阶段性调研，专人专职提高课程科学性。

严格考核机制

学员入学需严格测试，入班后每周小测、阶段大测，通过严格考核，了解学员对知识的掌握情况。

企业技术老师

特聘请原新浪、国企等大数据负责人，从技术角度讲述实战项目，吊打其他机构初级授课讲师。

学习硬件支撑

课程项目与企业无缝对接，重金采购10台集群与服务器提供硬件支撑，拒绝虚拟小作坊式学习。

精选课程只为满足你的要求

基础课

夯实专业课根基，剖析大厂主流技术，为好程序员高级班提供严选对象。

专业课

学科核心课程，接触企业技术直击企业刚需，提高学员专业技能和项目开发能力。

项目课

包含学科内学员自研项目和多学科联合项目，让学员深刻理解企业级大数据项目。

企业课

企业合作项目课程、管理课程，为学员深度接触企业实战项目和技术创造条件。

就业课

学习有效的沟通表达训练和职业素养课程，团队构建注意事项，为学员就业保驾护航。

职后课

行业高新技术，技术深度剖析，技能拓展等职后课，继续为已经就业的学员续航。

学什么？重点我们帮你圈

阶段 JavaSE+

主题主要内容 Java基础语法计算机理论介绍

编程基础--进制分类,进制转换等

JDK的安装与环境变量的配置

注释

数据类型

标识符

变量和常量

转义字符

数据类型转换

常用运算符

分支流程控制-if

分支流程控制-switch

循环流程控制-while

循环流程控制-for

方法的定义与调用

方法的参数与返回值

方法的重载

方法的递归

数组的定义与元素访问

数组的内存分析

数组的常见操作

数组排序

Java面向对象面向对象与面向过程

类的设计

对象的实例化

对象的内存分析

类中成员的访问

类是一种自定义的类型

this关键字

包(package)的创建与使用

构造方法

private关键字与属性封装

单例设计模式

继承基本的概念

继承中的特点

继承中的构造方法

方法的重写

final关键字

super关键字的使用

Object类

对象的转型

instanceof关键字

抽象类与抽象方法

接口

常用类、异常、集合 Lambda表达式

内部类

包装类型

常用类Random、Date、SimpleDateFormat、Calendar

枚举

异常定义

常用结构.

finally关键的应用

自定义异常

String类常用方法

StringBuffer/StringBuilder的常用方法

正则表达式

集合框架Collection

集合中元素排序

Collections工具类

泛型

集合框架Map

HashMap集合

TreeMap集合

可变参数

Arrays工具类

基本数据结构

Java多线程和IO 多线程概念

并发与并行

创建线程的方式

线程常用方法

线程生命周期

临界资源问题

同步代码段synchronized关键字

同步方法synchronized关键字

lock和unlock

线程死锁

生产者消费者设计模式(一对一)

懒汉式单例设计模式中的线程安全问题

File常用方法

流的基础

流的分类

字节流

字符流

转换流

缓冲流

对象流

Properties文件操作

NIO和NIO.2（缓冲区、通道、Paths.get、Files）

Class类

Class获取对象的三种方式

Constructor构造方法

Field 属性

Method方法

反射实例

MySQL+JDBC SQL简介

SQL表的概念

数据库的安装卸载

登录MySQL和MySQL常用命令

MySQL中常用的基本数据类型

数据库DDL操作

数据库DML操作数据库DQL操作

数据库DQL操作

数据完整性

数据库的索引操作

表与表之间的关系

多表查询

常见函数应用

数据备份与恢复

JDBC原理

JDBC的实现

JDBC实例-模拟登陆

SQL注入问题

xml和json讲解

数据库事务

连接池

连接池原理

常用的三方连接池DBCP、C3P0和Druid

DBUtils三方工具的使用

第二阶段 Hadoop生态+

主题主要内容 Linux和Shell脚本 CentOS 7.7安装部署常见文件操作命令常用系统操作命令常用的四种软件安装部署 Shell脚本中变量 Shell脚本数组、if-el分支、循环和方法等 Shell脚本调试 crontab定时器 HDFS分布式文件系统 HDFS组件概述 Hadoop安装部署 HDFS中的服务功能 HDFS工作机制 HDFS读写流程 HDFS的api操作 Zookeeper Zookeeper的定义 Zookeeper的应用场景 Zookeeper的服务及功能 Zookeeper整体架构 Zookeeper的选举机制 Zookeeper中事务 Zookeeper安装部署 Zookeeper操作 HDFS的HA部署 MapReduce YARN的组件 YARN的架构 YARN的调度方式 YARN工作原理 MapReduce模型 MapReduce中shuffle机制 MapReduce中的partitioner MapReduce中的自定义输入输出 MapReduce中的join操作 MapReduce中的压缩 MapReduce优化 Hive Hive架构 Hive安装部署 Hive的DDL操作 Hive的DML操作 Hive分区 Hive分桶 Hive数据加载 Hive中数据类型 Hive的常见内部函数 Hive自定义函数(UDF|UDAF) Hive视图 Hive索引 Hive优化 Presto Presto部署 Presto命令行接口 Presto的JDBC驱动 Presto队列配置 Presto的连接器 Presto的函数和运算符 Presto的数据类型 Presto的sql操作 Presto从Hive迁移 Presto的函数 Hbase Hbase架构 Hbase组件 Hbase工作原理 Hbase的shell操作 Hbase的api操作 Hbase的合并 Hbase的触发器 Hbase的过滤器 Hbase的RowKey设计 Hbase的优化操作 Phoenix Phoenix安装部署 Phoenix的四种操作方式 Phoenix的DDL和DML Phoenix的视图 Phoenix的二级索引 Phoenix的分页实现 Kylin Kylin架构 Kylin安装部署 Kylin数据源添加 Kylin的Mode创建 Kylin的Cube构建 Kylin的Cube运行 Kylin的支持的操作 Kylin的优化 Sqoop Sqoop架构 Sqoop安装部署 Sqoop的工作原理 Sqoop的Import和Export Sqoop增量和全量操作 Sqoop元数据 Sqoop的Job操作 Sqoop代码脚本化 Flume Flume架构 Flume安装部署 Flume的source、channel、sink Flume的selector使用 Flume的实时采集 Flume自带拦截器和自定义拦截器 Flume多agent部署 Flume的容错 Azkaban Azkaban架构 Azkaban部署 Azkaban的Shell案例 Azkaban的MapReduce案例 Azkaban的Hive案例 Azkaban的Sqoop案例 Azkaban的定时案例 Azkaban的2.0语法 Azkaban的用户和权限 Azkaban的优化 Git Git相关概念 Git安装部署 Git命令行操作 Git版本库创建 Git中分支操作 Git冲突解决 GitHub和GitLab介绍使用 Git和IDEA整合使用数据仓库数据仓库定义数据仓库四大特征数据仓库主题数据仓库集市数据粒度数据仓库中维度数据仓库中缓慢数据变化处理数据仓库分层

第三阶段 Spark生态+

主题主要内容 Scala基础 Scala环境部署编码规范 var和val的区别数据类型表达式循环定义方法和函数数组(Array) 映射(Map) 元组(Tuple) 列表(List) Set 集合的重要函数类、特质、抽象类、对象、继承模式匹配和样例类高阶函数隐式转换和隐示参数泛型 Netty的概念 Spark Core Spark简介 Spark运行模式 SparkShell RDD的概念详解 Transformation算子 Action算子 DAG有向无环图 RDD任务的切分 Lineage(血统) Checkpoint检查点机制 Spark集群启动流程和任务提交流程自定义排序自定义分区 Accumulator累加器 Broadcast广播变量 Shuffle原理剖析与源码分析 SparkSubmit执行流程集群启动流程详解 SparkContext执行流程 Task提交流程详解 Stage划分过程详解 Spark内核源码 Spark启动脚本解析 Spark提交流程解析应用提交和Driver进程 SparkContext解析 Spark executor解析 Spark的部署模式 Spark的shuffle流程 Spark的内存管理 Spark SQL SparkSQL介绍 SparkSQL的操作方式 SparkSQL的数据抽象 Spark-shell基本操作数据转换(RDD,DataFrame,DataSet) 数据操作方法(DSL和SQL) SparkSQL自定义函数(UDF,UDAF,开窗函数) Spark集成Hive(内置Hive和外置Hive) Kafka消息队列 Kafka的组件介绍 Kafka集群部署 Kafka文件存储机制 topic中partitioner的分布 Kafka分区中的Segment Kafka分区和消费者的关系 kafka日志合并 kafka的生产者案例 Kafka的消费者案例 Kafka自定义分区器 Kafka消费者组 Zookeeper如何管理Kafka Redis Redis的应用场景 Redis安装部署 Redis数据类型的cli和api操作 Redis的数据类型和操作案例 Redis主从复制 Redis集群部署 Redis的连接池 Redis中的雪崩、穿透和击穿问题 Spark Streaming Spark Streaming的原理介绍 DStream的概念 DStream原语类型介绍 DStream的Transformation(转换)、Output(输出) 窗口操作案例实现 Spark Streaming结合Kafka案例实现背压和反压机制如何数据的一致性 Structured Streaming实战 Spark Mllib Spark MLlib简介 Spark MLlib组件介绍 Word2Vec TF-IDF ALS GBDT LR MinMaxScaler OneHotEncoder Elasticsearch Elasticsearch的相关概念 Elasticsearch及插件安装部署 Index的概念 Document的概念 Mapping映射的概念 Elasticsearch的数据类型 Elasticsearch的聚合操作索引rest和api相关操作 Elasticsearch的SQL操作 Elasticsearch过滤器 IK分词器集成Elasticsearch 查询文档分页操作 Kibana插件操作 ClickHouse ClickHouse概念 ClickHouse安装部署客户端连接和JDBC方式访问ClickHouse 数据类型 ClickHouse的ddl和dml操作 ClickHouse表引擎 ClickHouse优化

第四阶段 Flink生态+

主题主要内容 Flink基础 Flink部署模式 Flink Streaming DataStream API介绍 Flink Streaming DataSource、Transformations、Sink详解 Flink的connector Flink的自定义输入输出 Flink中两阶段提交 Flink中的操作链 Flink DataSet的DataSource、Transformations、Sink详解 Flink Table API和SQL应用 Blink Table的操作 Sql与hive的整合 Flink的序列化 Flink的广播变量 Flink的累加器 Flink的分布式缓存 Flink的状态管理和恢复 Flink的CheckPoint Flink失败重启 Flink中Time Flink窗口 EventTime与Watermarks Flink的CEP Flink的新特性 Flink的优化

完善就业服务，助你进入好企业

就业复盘

统计数千名毕业老学员所在公司使用到的实际企业技术及学员大厂面试反馈。

辅导职业素养

提升职业素养及职业能力，掌握企业生存的法则，提升级职场竞争力，激发潜能。

技术提升服务

老学员可享技术提升，根据市场需求课程实时更新发布，企业主流技术。

沈阳IT培训

沈阳IT培训

沈阳IT培训

沈阳大数据培训中心

沈阳大数据培训中心课程详情

热门课程