Python培训_北京Python培训班_好口碑Python培训机构-黑马程序员

课程更新日志按周更新热点/前沿技术

新增2024-11-28

· 基于关联规则的推荐原理与实现
新增2024-11-27

· 基于用户的协同过滤推荐原理与实现
新增2024-11-26

· 基于ALS算法的协同过滤推荐原理与实现基于物品的协同过滤推荐原理与实现
新增2024-11-25

· 推荐系统常见概念和算法基于流行度的推荐原理与实现
升级2024-11-24

· Fine BI的数据连接和数据集的配置方法挖掘类标签开发
新增2024-11-23

· 基于Elasticsearch DSL语句的标签查询方法基于Doris SQL语句的标签查询方法
新增2024-11-22

· HiveSQL/PySpark程序/SparkSQL/SeaTunnel的任务部署方式
新增2024-11-21

· 业务库数据实时采集 SeaTunnel CDC介绍与使用 Window Watermark介绍与使用
升级2024-11-20

· Nginx日志清洗与分析用户行为日志清洗与分析
升级2024-11-19

· 匹配类标签开发统计类标签开发 Flume数据采集方案
升级2024-11-18

· 创建逗号分词器设计ES索引
升级2024-11-17

· Hive数据读取和MySQL规则处理
升级2024-11-16

· 标签计算流程
新增2024-11-14

· 基于SeaTunnel的数据同步
新增2024-11-13

· SeaTunnel Web使用
新增2024-11-12

· SeaTunnel的常见使用方式
新增2024-11-11

· SeaTunnel基本概念及特点
新增2024-11-10

· Elasticsearch SQL的使用
升级2024-11-09

· Elasticserch检索方式
新增2024-11-08

· Elasticsearch的基本使用
新增2024-11-07

· RESTful API用法与优势
新增2024-11-06

· Elasticsearch特点和作用
升级2024-11-05

· 全文检索
新增2024-11-04

· 小兔智购用户画像及推荐系统解决方案
新增2024-11-03

· 小兔智购用户画像及推荐系统的项目背景用户画像的构建方式
升级2024-11-01

· 用户画像作用及应用
新增2024-10-30

· 小兔智购用户画像及推荐系统的项目背景
新增2024-10-27

· 使用DataWork完成维度建模
新增2024-10-23

· DataWork数据指标功能介绍与使用
新增2024-10-19

· DataWork数据标准功能介绍与使用
新增2024-10-15

· 使用DataWorks完成数仓规划
新增2024-10-12

· 数据建模的概念必要性
新增2024-10-08

· DataWorks数据质量功能
新增2024-09-28

· DataWorks数据地图功能
新增2024-09-24

· DataWorks安全中心功能
新增2024-09-17

· DataWorks数据治理中心功能
新增2024-09-13

· 数据治理流程
新增2024-09-07

· 数据治理概念和背景
新增2024-09-03

· 使用Paimon构建流批一体数仓
新增2024-08-26

· Kafka/Redis的实战使用
新增2024-08-22

· 使用MaxCompute开发离线数仓
新增2024-08-17

· 基于FineBI的黑马出行项目可视化
升级2024-08-13

· FineBI的基本使用
新增2024-08-06

· 黑马出行投诉申诉主题业务及指标
新增2024-07-31

· 黑马出行乘客主题业务及指标
新增2024-07-27

· 黑马出行司机主题业务及指标
新增2024-07-20

· 黑马出行订单主题业务及指标
新增2024-07-15

· 使用阿里云Flink开发实时数仓
新增2024-07-12

· ODS层流批一体开发方法
新增2024-07-08

· 维度主题湖仓一体开发方法
升级2024-07-05

· 数据仓库分层及主题划分意义
新增2024-07-02

· 运维中心的使用
新增2024-06-29

· 基于DataWorks的数据开发流程及操作
新增2024-06-25

· DataWorks数据集成的使用
新增2024-06-23

· DataWorks基本功能介绍
新增2024-06-18

· 基于StarRocks实现即席查询案例
新增2024-06-13

· StarRocks查询数据湖
新增2024-06-08

· StarRocks分区分桶
新增2024-06-03

· StarRocks数据模型
新增2024-05-30

· StarRocks基本介绍
新增2024-05-25

· 完成阿里云环境搭建
新增2024-05-20

· 了解阿里云组件基本介绍
新增2024-05-13

· 黑网约车行业发展现状及大数据应用
新增2024-05-06

· 黑马出行业务与平台介绍
新增2024-04-29

· Paimon和Hive的集成· Paimon文件操作
新增2024-04-22

· Paimon的使用
新增2024-04-15

· Paimon基本介绍 Hudi安装
新增2024-03-28

· DataX部署与使用
新增2024-03-22

· DataX Web部署与使用
升级2024-03-15

· Hive参数优化
升级2024-03-08

· 数据同步方案
新增2023-03-01

· PostgreSQL部署与使用
升级2024-02-23

· DolphinScheduler使用
升级2024-02-16

· 数仓项目开发思路
升级2024-02-09

· FineReport服务器部署· FineReport基本使用
新增2024-02-09

· FineReport报表开发· FVS大屏开发
新增2024-01-26

· Flink· CDC· 3.0特性与使用
升级2024-01-19

· Flink· CDC· DataStream案例和SQL案例
新增2024-01-12

· Hive Dialect使用· Hive Catalog使用
升级2024-01-05

· Flink读写Hive· Hive维表关联
新增2023-12-29

· Hudi简介· Hudi安装与简单使用
新增2023-12-22

· Hudi核心概念· Flink读写Hudi
新增2023-12-15

· Hudi on Hive的原理和使用
新增2023-12-08

· Doris简介· Doris安装与简单使用
新增2023-06-21

· 量化机制的介绍· 图优化方法的使用
新增2023-12-01

· Doris Aggregate模型使用· Doris Unique模型使用· Doris Duplicate模型使用
新增2023-11-24

· Doris Partition划分· Doris Bucket划分
新增2023-11-17

· Broker Load· Stream Load· Routine Load· 数据导出
新增2023-11-10

· Doris join方式和join 优化
新增2023-11-03

· Doris Rollup· 物化视图
新增2023-11-27

· Doris动态分区
新增2023-10-20

· Doris多源目录· Doris与Flink集成
新增2023-10-13

· Dinky部署· Dinky简介· Dinky使用
升级2023-10-06

· 实时数仓开发流程与建模设计
新增2023-09-29

· 湖仓一体架构开发维度主题
新增2023-09-22

· 流批一体架构设计
新增2023-09-15

· 流批一体架构开发电商销售主题
升级2023-09-08

· 电商日志解析
新增2023-09-01

· Taildir Souce与Kafka Channel配合采集日志
升级2023-08-25

· ProcessFunction使用· FlatMapFunction使用
新增2023-08-18

· Flink侧输出流使用
升级2023-08-11

· Flink状态编程· Flink TTL设置
新增2023-08-04

· Flink CEP原理介绍· Flink CEP实战
升级2023-07-28

· Flink UDTF函数开发与使用
新增2023-07-21

· 反压产生的原因及问题的定位
升级2023-07-14

· KafkaSource调优
升级2023-07-07

· Flink SQL的调优· Flink内存调优
新增2023-06-30

· Flink JDBC工具类编写· Flink Kafka工具类编写
新增2023-06-15

· yoloV8的架构解析· 双流FPN结构的设计
新增2023-06-08

· FlinkSQL表参数· FlinkSQL解析器
新增2023-06-02

· FlinkSQL的Split分桶· FlinkSQL执行计划翻译器参数
新增2023-05-26

· FlinkSQL的上游CDC去重· FlinkSQL多阶段聚合
新增2023-05-18

· FlinkSQL参数优化· FlinkSQL异步IO容量· FlinkSQL并行度设置
新增2023-05-12

· FlinkSQL语法· FlinKSQL UDF
新增2023-05-06

· Barrier（栅栏）机制

升级

· PyFlink
新增2023-04-27

· Flink状态后端· Flink重启策略
新增2023-04-19

· 窗口计算中时间的流逝问题· 窗口的开始和结束范围
新增2023-04-12

· Window TVF 方案· Group Window Aggregation方案
新增2023-04-07

· 动态表和连续查询· Flink中的时间属性
新增2023-03-31

· sql-client和Flink JobManager的连接· sql-client结果的显示模式
新增2023-03-23

· TableEnvironment· sql-client 工具

升级

· Flink Table & SQL API
新增2023-03-14

· Oracle的备份恢复· Oracle的OEM· Oracle的冷热备份· Oracle的备份恢复
新增2023-03-09

· Oracle的权限管理· Oracle的审计
新增2023-03-01

· Oracle的进程结构和内存结构· Oracle的监听器
新增2023-02-22

· Oracle数据库管理· Oracle存储结构
新增2023-02-16

· Oracle的存储函数· Oracle的存储过程· Oracle的触发器
新增2023-02-08

· Oracle的PLSQL编程· Oracle的游标
新增2023-02-03

· Oracle索引· Oracle事务· Oracle常用工具
新增2023-01-29

· Oracle序列· Oracle同义词
新增2023-01-18

· Oracle视图· Oracle物化视图
新增2023-01-10

· Oracle数据定义语言· Oracle常见对象
新增2023-01-04

· Oracle基础· Oracle的查询语法及综合案例
新增2022-12-27

· Hive的explain执行计划详解· Hive数据压缩、存储格式、自动化脚本、常见性能优化内容优化
新增2022-12-21

· PSM价格敏感度模型开发· Presto对接多数据源实现指标统计分析
新增2022-12-13

· RFM用户价值度模型开发· RFE用户或月底模型开发
新增2022-12-07

· 用户画像解决方案项目BI可视化实时统计结果数据· 用户画像解决方案项目BI可视化流程
新增2022-12-01

· 用户行为埋点日志etl· 用户行为埋点日志聚合统计· 用户行为埋点日志统计结果入库
新增2022-11-24

· 用户行为埋点日志产生流程与漏斗模型
新增2022-11-17

· nginx日志ip定位，uv、pv、ua、access_time解析· nginx日志入库mysql· 实时分析任务基类开发
新增2022-11-08

· nginx日志介绍与产生的流程· nginx日志解析etl· nginx日志聚合统计
新增2022-11-03

· 操作采集nginx日志到kafka中· 结构化流实现消费nginx日志数据案例
新增2022-10-26

· flume实现采集数据到hdfs· flume实现数据采集到kafka· 实时基础与kafka要点回顾
新增2022-10-20

· flume与实时数据采集流程· flume概述与核心要素· 标签类型与总结
新增2022-10-13

· 购买周期标签思路与实现· 支付方式标签思路与实现· 标签类型与总结
新增2022-10-07

· 作业讲解，实现2个匹配标签开发· 统计类标签开发
新增2022-09-26

· 基于标签开发基类重写统计类标签和规则类标签
新增2022-09-20

· spark实现统计类标签开发· spark实现规则类标签开发
新增2022-09-14

· spark与mysql整合· spark与es整合
新增2022-09-06

· 用户画像数据检验的三种方式· 从hive导入数据到es实现· es元数据对象解析
新增2022-08-29

· es集成hadoop生态圈· es-hive支持· es-hive案例与参数
新增2022-08-23

· es核心原理与关键概念· es的resultful api· python代码操作es
新增2022-08-17

· es基础· 使用es的原因· es的架构
新增2022-08-09

· 核心业务流程· sparksql分析引擎· 数仓六层模型
新增2022-08-01

· 自动导入oracle数据 · 自动创建文件目录· 记录自动化过程日志
新增2022-08-01

· 自动导入oracle数据 · 自动创建文件目录· 记录自动化过程日志
新增2022-07-25

· 自动创建hive表· 自动创建hive分区· 自动关联hdfs数据
新增2022-07-18

· 数仓建模方法论· 日期维度程序生成· 维度模型选型
新增2022-07-11

· docker虚拟网桥与网卡· 宿主机与docker容器 · 创建大数据组件容器
新增2022-07-04

· 行程地理区域维度· 组织机构维度· 服务网点维度
新增2022-06-28

· 加油站维度· 服务属性维度· 物流公司维度· 故障维度
新增2022-06-28

· 加油站维度· 服务属性维度· 物流公司维度· 故障维度
新增2022-06-21

· 数仓整体设计图· 技术选型设计图· 项目原始数据库结构图
新增2022-06-14

· ODS建模后，使用SQOOP导入数据· DWD根据业务使用全量表、增量表、拉链表等不同的方式实现· DWB层的订单明细表关联了订单表、订单副表、订单组表、店铺表、地区表、订单商品快照表等· 商品明细表关联了商品表、商品分类表（三层分类）、商品品牌表等
升级2022-06-07

· 使用新版数据库，包含完整的订单、商品、用户、配送及支付、退款等数据· 实战提取订单相关的指标和维度 · Flink多语言开发· Flink监控调优
新增2022-05-31

· Flink背压机制· Flink内存管理· Python语言操作Flink
新增2022-05-24

· FlinkSink新特性· FlinkSQL整合Hive· 分层规范，通过对数据业务的分析，将数仓分为ODS, DWD, DWB, DM, APP五层
新增2022-05-17

· FlinkSQL&Table理论部分比重，移除过期API,使用新版API · FlinkSQL整合Kafka案例· 双流Join知识点和案例分层规范，通过对数据业务的分析，将数仓分为OD· S, DWD, DWB, DM, APP五层
新增2022-05-10

· Flink版本为1.14· 弱化DataSetAPI讲解,加强DataStreamAPI-流批一体新特性的讲解· 移除过期API,增加DataStream、Window、Watermaker新版API使用讲解
新增2022-05-03

· 实时业务-实时统计Top10热点题· 实时业务-实时统计答题最活跃的Top10年级· 实时业务-实时统计Top10热点题及所属科目
新增2022-04-26

· 数据模拟程序写入到Kafka· 实时分析学生答题情况· StructuredStreaming实时分析入口程序· python完成电商行业ETL实战· ETL基础概念· ETL完成的Pipeline构建流程
新增2022-04-19

· 结构化流更新，删除Rate数据源-文件数据源· 删除企业不常用SparkStreaming
新增2022-04-12

· Spark中Continuous Processing· Spark3.2新特性· Spark性能调优九项原则、数据倾斜、shuffle优化· 新增Spark教育行业案例，方便学员掌握RDD和DataFrame的使用
新增2022-04-05

· StructuredStreaming 处理延迟数据和水印· StructuredStreaming 结构化流数据和静态数据Join· StructuredStreaming 结构化流数据和结构化路数据Join
新增2022-03-29

· 离线业务分析-各科目热点题分析· 离线业务分析-各科目推荐题分析
新增2022-03-22

· StructuredStreaming 物联网设备数据分析案例· StructuredStreaming 基于事件时间的窗口
新增2022-03-15

· SparkSQL底层执行原理· StructedStream结构化流内容· Pandas的教育案例数仓实战
升级2022-03-08

· 升级Spark版本到3.2· 升级Spark的主流开发语言为Python· 优化Spark的Standalone方式安装,使用local和yarn模式· Spark3.2整合Hive3.1.2版本兼容问题
新增2022-03-01

· MySQL的教育案例数仓实战· Pandas基础使用,作为理解Spark数据类型的基础· Pandas的Series数据结构· 增加在线教育案例
新增2022-02-25

· Python版本Hbase的API调用· Python的教育案例数仓实战· StructuredStreaming Sink内容· StructuredStreaming 整合Kafka
新增2022-02-18

· Flume采集MoMo数据集场景· 实时和离线方式处理数据场景· Python版本Kafka的调用· NoSQL阶段多场景项目实战
新增2022-02-11

·Flume1.9数据采集方式· Hbase2.x新特性

升级

· Hbase的BulkLoader全量数据加载方式
新增2022-02-04

·Python版本MapReduce写法
新增2022-01-28

· python脚本实现增量从oracle导入数据到hdfs中· python脚本实现全量从oracle导入数据到hdfs中· python脚本实现上传avro文件到hdfs上
新增2022-01-21

· python脚本实现压缩表的avro文件为tar.gz文件· python脚本实现avro压缩文件上传hdfs· python实现读取oracle表原始数据· python实现创建hive表· python实现创建hive表
新增2022-01-14

· python实现自定义记录日志· python实现读取一行行文本文件工具类· python读取表信息转对象方法· python实现sparksql创建数据库和表· python实现sparksql创建分区关联表对应的hdfs数据方法
新增2022-01-07

· python实现sparksql查询ods层明细数据并加载到dwd层方法· python实现sparksql查询ods层明细数据并加载到dwd层方法· 造数据平台· 新特殊字段类型
新增2021-12-24

· 字段类型· flink源码前置基础· 源码的编译和部署· flink启动脚本的解读· yarn-per-job模式解析
新增2021-12-17

· flink任务调度机制· flink内存模型· HIve3新特性· Hive3数据压缩，存储格式等内容· Hadoop3新特性
新增2021-12-10

· 概念和通用api介绍· sqlclient工具的使用· catalogs知识点的学习· 流处理中的概念介绍
新增2021-12-03

· flinksql中的窗口使用（Application Mode）· FlinkSQL函数操作· Flinksql连接到外部系统· flinksql的原理和调优· sql操作参考
新增2021-11-26

· flink on yarn的第三种部署方式（Application Mode）· 自定义source· transformation算子minby和maxby· transformation算子minby和maxby· flink的global window的操作
新增2021-11-19

· flink内置水印函数的操作· flink的window的ReduceFunction· flink的window的AggregateFunction· flink的window的ProcessWindowFunction· flink的window的具有增量聚合的ProcessWindowFunction
新增2021-11-12

· flink的window的在 ProcessWindowFunction 中使用每个窗口状态· flink的state的ttl机制· flink的state的数据结构的api升级例· flink的Queryable State知识点· 异步io的vertx框架实现
新增2021-11-05

· flink的join操作· Streaming File Sink连接器的小文件操作· 数据类型及序列化的原理和实现案例· 热门销售排行TopN的使用案例· 布隆过滤器结合TTL的使用案例
新增2021-10-29

· PySpark的安装· PySpark任务提交方式· PySpark多种模式spark-submit· PySpark多种模式spark-submit
新增2021-10-22

· Anaconda安装使用· Python实现RDD的基础的Transformation操作· Python实现RDD的Action操作· Python实现Sougou分词案例· Python实现IP热度分析案例
新增2021-10-15

· Python实现PV-UV-TOPK案例· Python实现累加器及案例优化· Python实现广播变量案例及优化· Python实现缓存案例及优化实现· PySparkSQL实现基础统计操作
新增2021-10-08

· PySpark实现DataFrame的基础操作· PySpark实现DataFrame的wordcount操作· PySpark实现DataFrame和RDD的转换操作· PySpark实现电影评分数据集分析
新增2021-09-24

· PySpark的底层Dataframe如何转化为RDD的原理操作· PySparkSQL的优化方式· PySparkSQL分布式引擎实现· PySparkSQL与HIve整合· PySpark离线教育案例
新增2021-09-17

· PySpark新零售分析案例· ETL、ELT区别· Hive CTE表达式、更新union联合查询· 大数据5V特点· 大数据多个应用场景
更新2021-09-10

· pandas及可视化课程迭代至v2.01· 数据分析多场景项目迭代至v1.81 · 最新版Python基础编程v2.01· 最新版Python编程进阶更新迭代至v2.01· 制定v2.0版本课程大纲
升级2021-09-03

· 完善flink的运行架构内容· 完善flink与kafka连接器的操作· 完善flink的window操作的讲义· 完善ODS层，新增和更新抽取方式，画图错误
更新2021-08-27

· Flink版本为1.13最新版· Flink table sql的整体概述 · 项目开发语言为spark官方使用最多的python语言
更新2021-08-20

· Spark语言为官方使用最多的Python语言· Spark版本为3.1.2发行版，Hive3.1.2版本
优化2021-08-13

· 升级HDFS读写流程原理图· 升级Hadoop为最新3.3.0版本· 升级编排Linux2天讲义升级编排Linux2天讲义· 升级Mysql RPM安装方式以支持hive3
优化2021-08-06

· 优化Hive知识点案例同步为Hive3版本· 优化Linux基础命令，删除了不常用命令· 优化使用Python实现MR原理机制
优化2021-08-03

· 优化OLAP、OLTP区别· 优化Hadoop版本安装及注意事项· 优化Hadoop版本安装及注意事项· 优化Hive版本为最新的3.1.2版本
优化2021-07-27

· 优化HIve3.x架构· 优化PySpark执行流程，引入Py4J技术· 优化车联网Web展示部分· 优化车联网离线Hive数仓构建部分
新增2021-07-20

· 新增数仓整体设计图· 新增技术选型设计图· 新增项目原始数据库结构图
新增2021-07-13

· 新增油站维度· 新增服务属性维度· 新增物流公司维度· 新增故障维度
新增2021-07-06

· 新增行程地理区域维度· 新增组织机构维度· 新增服务网点维度· 新增数仓建模方法论· 新增日期维度程序生成
新增2021-06-29

· 新增维度模型选型· 新增自动创建hive表· 新增自动创建hive分区· 新增自动关联hdfs数据· 新增自动导入oracle数据
新增2021-06-22

· 新增自动创建文件目录· 新增记录自动化过程日志· 新增java和数据结构大数据题目4个· 新增算法题目4个· 新增Hadoop题目6个
新增2021-06-15

· 新增hive题目3个· 新增spark题目7个· 新增flink题目4个· 新增其他大数据组件题目4个· 新增美团大数据架构
新增2021-06-08

· 新增平安大数据架构解决方案· 新增小米大数据架构解决方案· 新增百度广告业务场景大数据架构解决方案
新增2021-06-01

· 新增Flume1.9数据采集方式· 新增Flume采集MoMo数据集场景· 新增实时和离线方式处理数据场景· 新增SparkWebUI功能解释
新增2021-05-25

· 新增SparkSQL比重· 新增StructedStream双流Join知识点· 新增Spark多语言开发-JavaSpark和PySpark
新增2021-05-18

· 新增SparkMlLib-ALS推荐算法案例和原理· 新增SparkMlLib-线性回归算法案例和原理· 新增SparkMlLib-决策树算法案例和原理
新增2021-05-11

· 新增Spark3.0新特性· 新增Spark性能调优九项原则、N多配置参数、数据倾斜、shuffle优化· 新增IP查询案例
新增2021-05-04

· 新增教师案例Spark案例· 新增DataStream、Window、Watermaker新版API使用讲解· 新增FlinkSQL&Table理论部分比重，使用新版API· 新增FlinkSQL整合Kafka案例· 新增双流Join知识点和案例
新增2021-04-26

· 新增Execl数据分析，整合Execl图标、透视表等使用· 新增Execl分析项目· 数据仪表板展示· 新增Tableau的BI分析工具及项目实战
新增2021-04-19

· 新增数据分析的Python语言· 新增Python基础语法与高级特性· 新增Python整合SQL的操作及案例· 新增网络爬虫数据采集基础及案例
新增2021-04-12

· 新增Python高阶语法支持· 新增Selenium自动化工具开发· 新增多场景爬虫项目实战· 新增Python的Numpy及Pandas数据分析框架
新增2021-04-05

· 新增Pandas数据清洗，数据整理及案例实战· 新增Matplotlib等数据可视化操作及案例实战· 新增Python机器学习原理理解，增加回归、分类及聚类· 算法原理
新增2021-03-29

· 新增Python机器学习库Sklearn多任务实战· 新增零售行业数据分析及挖掘项目案例· 新增电商行业数据分析及挖掘项目案例
新增2021-03-15

· 腾讯聊天机器人· 腾讯文字识别· python操作mycat· 小程序开发
新增2021-03-08

· django_extensions使用· axios网易案例· 阿里云方案· django-channels使用
新增2021-03-01

· pytest自定义插件使用· pytest异步调用· pytest定时执行· pytest标记使用
升级2021-02-22

· Cookie和Session使用 · Django类装饰器· Django多对多查询· Django关联查询
升级2021-02-15

· 推荐算法 · 数据可视化· sql数据查询· H5语法
升级2021-02-08

· 美多状态保持 · Django框架请求对象获取数据· Django模版· Django拓展类
新增2021-02-01

· asyncio编程 · RabbitMQ的Confirm机制· RocketMQ使用· Celery定时任务
增加2021-01-25

· Angular管道 · Angular路由· Angular使用HTTP· Angular表单
增加2021-01-18

· Ant Design · TypeScript类型断言制· TypeScript内置对象· TypeScript代码检查
升级2021-01-11

· Django认证 · Django权限控制· 美多商城发送短信· 美多商场QQ登录
优化2021-01-04

· SQL查询 · 数据仓库· 业务报表· Pandas
新增2020-12-28

· 机器学习排序算法 · 购物篮分析· RFM模型· K均值聚类算法
新增2020-12-21

· 物品画像 · 用户画像· 召回算法· 漏斗分析
升级2020-12-14

· 状态保持 · 权限管理· 页面静态化· xpath工具
升级2020-12-07

· 极验验证 · jieba分词· shell代码发布· 对象存储
新增2020-11-30

· ES集群搭建 · IK中文分词· ES聚合查询· ES冻结解冻索引
新增2020-11-23

· Kafka Broker集群 · Topic模型· kafka数据备份· kafka消息持久化
升级2020-11-16

· pandas的apply方法 · pandas的transform方法· pandas的to_numeric函数· Pandas内置聚合方法
升级2020-11-09

· elk日志监控 · shell代码发布· ubuntu版本20.04· 移动端测试
优化2020-11-02

· mysql读写分离 · reids哨兵· redis安全限制· Keepalived非抢占模式
新增2020-10-26

· VIP脑裂 · MyCAT使用· WA配置使用· redis持久化
新增2020-10-19

· HA Cluster高可用集群 · Keepalived使用· VRRP协议· nginx服务切换
升级2020-10-12

· fastDFS使用 · shell使用 · docker使用· nginx使用
升级2020-10-05

· cookie和session案例 · mysql主从 · mysql集群· redis主从
升级2020-09-28

· Django用户权鉴 · Django表单 · Django-froms· Django站点管理
新增2020-09-07

· Ansible使用 · AWX使用 · ceph使用· zabbix使用
升级2020-08-31

· 登录判断中间件 · cache缓存使用 · 购物车数据存储· git冲突解决
新增2020-08-24

· pyautogui使用 · uiautomator使用 · PO模式· mock测试
新增2020-08-17

· Django转换器 · Django用户认证拓展类 · Django权限认证拓展类· Haystack搜索类
升级2020-08-10

· python操作reids · redis高可用 · redis集群搭建· redis持久化
升级2020-08-03

· mysql事务使用 · mysql主从搭建 · mysql客户端使用 · mysql外键操作
新增2020-07-27

· mongodb聚合 · mongodb索引 · mongodb权限· 常见反爬手段
新增2020-07-20

· 缓存击穿 · 缓存雪崩 · 雪花算法
升级2020-07-13

· Locust 性能测试 shell编程 · msyql数据库 · redis缓存 ·
升级2020-07-06

· redis集群 · gitfollow工作流 · 定时爬虫 · elk
升级2020-06-29

· 响应对象的处理 · 细化Cookie及Session的处理 · 链接失效的爬虫案例 · 美后台权限控制
新增2020-06-22

· 高性能爬虫 · 多线程爬虫案例 · Flask-Migrate 数据模型设计 · 智慧大屏案例
升级2020-06-15

· UnitTest断言: 比较断言，复杂断言 · 路由系统全线升级 · 数据图片化反爬 · redis缓存
新增2020-06-08

· Jmter 图形监视器扩展插件 · 警告断言 · 异常断言 · Jmter性能调试
新增2020-06-01

· 性能测试报告分析 · 新增分库访问 · 优化Fixtures的参数化 · protometheus使用
新增2020-05-25

· flask-sqlalchemy二次开发 · 数据解析-BeautifulSoup4 · Jmeter分布式并发测试的配置 · zabbix使用
新增2020-05-18

· Jmeter实现参数化 · 数据库测试 · 实现跨线程组传值 · lua基础
新增2020-05-11

· 自定义读写分离 · 认证体系 · 访问劫持 · 安全策略
新增2020-05-04

· Redis悲观锁 · 布隆过滤器 · 文件安全 · WAF实践
升级2020-04-27

· 搜索接口结构 · elsticsearch使用 · celerybug处理 · rabbitMQ使用
升级2020-04-20

· Locust关联 · Locust断言 · Locust各种业务场景下的参数化 · pipeline使用
升级2020-04-13

· 更改Scrapy以及Scrapy-redis项目 · Selenium知识点演示案例 · redis哨兵机制 · mysql主从搭建
升级2020-04-06

· 时间戳/页码/偏移量分页 · gitflow工作流 · sentry使用 · xss安全
新增2020-03-30

· Pytest.mark · flask缓存工具类 · 多级缓存 · mysql注入攻击
新增2020-03-23

· 禅道的不同角色使用 · Mysql垂直拆分 · Flask-SQLAlchemy的读写分离 · Mysql水平拆分
升级2020-03-16

· 性能测试分类 · 性能监控指标 · 性能测试流程 · celery使用
新增2020-03-09

· 定时抓取数据爬虫 · Appium对APP数据的抓取 · 常见性能测试工具优化 · Filebeat详解
升级2020-03-02

· 禅道的部署方式 · django框架升级为2.25版本 · 美多详情页静态化 · 商品spu表结构
新增2020-01-16

· 美多商城缓存 · elk日志监控 · docker部署美多商城 · shell代码发布
升级2020-01-09

· 等价类划分法演示案例 · 边界值法的演示案例 · 容联云发送短信 · fastDFS图片上传
新增2020-01-02

· 测试用例的设计方法 · 获取用户信息模块的单元测试 · 登录注册模块的单元测试 · jenkins使用
升级2019-12-26

· Django自带单元测试模块 · Mysql数据库教法调整 · 黑马头条缓存使用 · dockerfile使用
新增2019-12-19

· Locust 性能测试 · HttpLocust和Locust · TaskSet TaskSequence · seq_task
升级2019-11-28

· 异常案例的讲解 · 代码健壮性提升方式 · 登录状态判断 · 异常处理
升级2019-11-21

· 商品模块代码进行了调整 · Redis事务型管道 · 反爬案例 · 搜索方法优化
新增2019-11-14

· 新增字体反爬 · Charles/fiddler抓包工具讲解 · Redis非事务型管道 · 新增shell编程
升级2019-11-07

· PO模型 · Requests模块的使用 · Get/Post等Http请求 · 试用例的设计方法
新增2019-10-31

· Flask项目搭建Flask-CORS · Fixtures实现SetUp和TearDown · 美多商城登录功能自动化测试 · Redis缓存数据集合
升级2019-10-24

· 黑马头条前端代码 · 分布式事务 · 美多商城前台改为前后端分离模式 · admin后端管理站点讲解
新增2019-10-17

· 美多商城支付模块单元测试 · Jmeter 性能测试报告 · TestCase Client FactoryRequest Mock · 美多商城下单模块性能测试
新增2019-10-10

· 黑马头条业务逻辑: 用户认证、修改头像 · 黑马头条业务逻辑: 频道管理 · 黑马头条业务逻辑: 文章列表/详情 · 黑马头条业务逻辑: 关注用户评论回复

prev next

2024.07.20 升级版本5.0

课程名称

AI+Python大数据开发课程

课程推出时间

2024.07.20

课程版本号

5.0

技术课程

Hadoop3.3，Spark3.4，阿里云Flink（FlinkCDC、FlinkCEP、FlinkSQL），Hudi，Doris，Starrocks，Paimon，ElasticSearch

课程介绍

AI+Python大数据开发V5.0课程全新升级，全面拥抱AI大模型，采用AI+编程助力数据开发提效，紧贴各类企业招聘需求，升级面向数据分析的AI Agent智能体实现高效数据开发，升级阿里云平台全套基于云平台的大数据技术栈，全程采用六项目制驱动技术学习，助力国家数字化转型对数字人才的大量需求。

V5.0 五大课程优势

优势1：AI大模型全程赋能，让数据分析更精准，开发更高效；优势2：1000+核心业务指标，多行业高效通用；优势3：前沿解决方案拿来即用，开发不必从零开始；优势4：联合阿里云共建课程，助力企业“上云”便捷开发；优势5：课程设置全面，热门数据岗位全覆盖。

● AI大模型全程赋能，让数据分析更精准，开发更高效（1、AI提高学习效率：全部技术阶段融入AI编程；2、AI提高项目开发效率：全阶段项目融入AI编程；3、AI提高阅读代码效率：复杂Spark算子的底层源码解读；4、通过AI提高刷题效率：学员能够用使用AI大模型进行数据开发方向面试题问答，让刷题更高效）。

● 多位Apache社区贡献者联袂授课，从原理、实战到源码，带你迈入高级开发工程师行列。

● 课程覆盖企业级大数据六大主流解决方案，包括离线数仓解决方案、基于StarRocks统一数仓解决方案和基于云平台的湖仓一体解决方案、用户画像解决方案、推荐系统解决方案、数据治理解决方案，再现公司中真实的开发场景，目标不止于就业，而是成为各类企业争抢的大数据开发工程师。

● 课程升级主流企业级数仓解决方案，包括基于StarRocks统一数仓解决方案和基于云平台的湖仓一体解决方案，不仅可以学习到企业真实完整的业务场景，将六大技术解决方案应用到黑马甄选泛电商业务中，能胜任企业级离线数仓、实时数仓、用户画像、推荐系统、数据治理等核心大数据开发工作。

● 继V4.5版本推出黑马甄选离线数仓业务之后，V5.0版本增加了黑马甄选用户画像和推荐系统的全套解决方案课程，课程采用由浅入深,层层递进的讲解方式, 让学生轻松掌握企业级用户画像系统的设计与开发全流程，项目使用的技术栈包括Spark、ES、Doris、SeaTunnel、Kafka均为时下主流的大数据技术，项目使用Structured Streaming开发实时类标签，使用SeaTunnel做数据同步，使用ES和Doris存储结果数据及使用Spark MLlib开发推荐系统。该项目构建适合全场景的用户画像+推荐系统解决方案。

新增面向数据分析的AI Agent智能体实现高效数据开发，提升数据分析和查询效率。满足就业市场中数据工程师+AI大模型技能的需求，提升学生就业竞争力。

新增基于StarRocks统一数仓解决方案，提升数据分析和查询效率。满足就业市场中中高级数据工程师需求，提升学生就业竞争力。

新增基于云平台的湖仓一体解决方案，项目采用阿里云Flink结合Paimon,完成实时计算和流批一体存储，采用DataWorks+MaxCompute完成离线数仓开发，使用DataWorks完成数据治理等内容，该方案对各行业大数据平台建设都有极强借鉴意义。让学员具备基于阿里云DataWorks、MaxComputer及Flink等技术能力要求，增加学员的就业选择范围。

新增黑马甄选用户画像和推荐系统的全套解决方案课程，，采用大规模Spark机器学习和个性化推荐技术，达到企业级提供一站式推荐服务能力搭建平台，提升学生就业竞争力

优化Paimon、Hudi新技术，将技术应用到实时项目中，更加全面提升通过技术解决业务问题能力。

优化新版面试加强课，内容集成了大厂架构解析、SQL专项面试宝典，以及不断滚动更新的全网大数据岗位面试题讲解，助力学员高起点就业。

优化大数据BI报表开发项目实战阶段，通过Python+SQL+FineReport完成电商业务统计分析和大屏展示。

友情提示更多学习视频+资料+源码，请加QQ：2632311208。

2024.04.21 升级版本4.5

课程名称

Python+大数据开发课程

课程推出时间

2024.04.21

课程版本号

4.5

技术课程

Hadoop3.3，Spark3.4，阿里云Flink（FlinkCDC、FlinkCEP、FlinkSQL），Hudi，Doris，Starrocks，Paimon，ElasticSearch

课程介绍

● Python大数据V4.5课程全新升级，紧贴各类企业招聘需求，升级阿里云平台全套大数据技术栈，全程采用六项目制驱动技术学习，助力国家数字化转型对数字人才的大量需求。

● 多位Apache社区贡献者联袂授课，从原理、实战到源码，带你迈入高级开发工程师行列。

● 课程覆盖企业级大数据六大主流解决方案，包括离线数仓解决方案、流批一体解决方案和湖仓一体解决方案、用户画像解决方案、推荐系统解决方案、数据治理解决方案，再现公司中真实的开发场景，目标不止于就业，而是成为各类企业争抢的大数据开发工程师。

● 课程升级主流大数据技术栈，全新Hadoop3.3，Spark3.4，阿里云实时计算Flink技术剖析和新特性使用，推出黑马甄选业务的全套解决方案课程，不仅可以学习到企业真实完整的业务场景，将六大技术解决方案应用到黑马甄选泛电商业务中，能胜任企业级离线数仓、实时数仓、用户画像、推荐系统、数据治理等核心大数据开发工作。

新增数据治理解决方案，结合包括元数据管理、数据标准、指标系统、数据建模等在内的数据治理能力，聚焦企业数字化转型，深挖数据价值，提升企业数据生产力。满足就业市场中中高级数据工程师需求，提升学生就业竞争力。

新增数据分析相关的课程内容，让学员具备数据分析岗位的能力要求，增加学员的就业选择范围。

新增多场景离线数仓项目解决方案，基于Starrocks数据库完成数仓的搭建，结合多场景的业务丰富学生对业务理解能力。

优化推荐系统解决方案，采用大规模机器学习和个性化推荐技术，达到企业级提供一站式推荐服务能力搭建平台，提升学生就业竞争力。

优化Paimon、StarRocks新技术，将技术应用到实时项目中，更加全面提升通过技术解决业务问题能力。

优化新版面试加强课，内容集成了大厂架构解析、SQL专项面试宝典，以及不断滚动更新的全网大数据岗位面试题讲解，助力学员高起点就业。

优化黑马甄选实时计算项目由阿里云实时计算Flink全栈开发，从FlinkCDC数据采集，Kafka实时数仓分层，Paimon数据湖构建湖仓一体架构，将数据接入Starrocks进行OLAP分析和查询，最后通过DataV完成企业级业务大屏展示。

优化大数据BI报表开发项目实战阶段，通过Python+SQL+FineReport完成电商业务统计分析和大屏展示。

2023.08.21 升级版本4.0

课程名称

Python+大数据开发课程

课程推出时间

2023.08.21

课程版本号

4.0

技术课程

Hadoop3.3，Spark3.4，阿里云Flink（FlinkCDC、FlinkCEP、FlinkSQL），StarRocks，Paimon，ElasticSearch

课程介绍

● Python大数据V4.0课程全新升级，紧贴各类企业招聘需求，升级阿里云平台全套大数据技术栈，全程采用六项目制驱动技术学习，助力国家数字化转型对数字人才的大量需求。

● 多位Apache社区贡献者联袂授课，从原理、实战到源码，带你迈入高级开发工程师行列。

● 项目课程实施“讲A练B”与"看图说话"新模式, 以思路分析为导向提高学员独立开发能力,并推动学员在逻辑思维与语言表达能力方向的持续提升,为学员在面试中以及在企业独立开发中打下坚实的基础

新增通过AIGC助力编程效率提升，完成数据开发和数据分析任务。

新增Paimon、StarRocks新技术，将技术应用到实时项目中，更加全面提升通过技术解决业务问题能力。

新增新版面试加强课，内容集成了大厂架构解析、SQL专项面试宝典，以及不断滚动更新的全网大数据岗位面试题讲解，助力学员高起点就业。

更新由Apache Flink1.17课程升级为阿里云实时计算Flink版，通过阿里云全套大数据组件学习，贴近中小型企业大数据开发真实环境，提升学生就业竞争力。

新增黑马甄选实时计算项目由阿里云实时计算Flink全栈开发，从FlinkCDC数据采集，Kafka实时数仓分层，Paimon数据湖构建湖仓一体架构，将数据接入Starrocks进行OLAP分析和查询，最后通过DataV完成企业级业务大屏展示。

新增大数据BI报表开发项目实战阶段，通过Python+SQL+FineReport完成电商业务统计分析和大屏展示。

2023.01.01 升级版本3.2

课程名称

Python+大数据开发课程

课程推出时间

2023.01.01

课程版本号

3.2

主要使用开发工具

PyCharm，IDEA，DataGrip，FinalShell

课程介绍

● 优势1：课程升级深度调研市场需求，针对行业解决方案：离线数仓解决方案、用户画像解决方案、湖仓一体解决方案，打造多行业多场景大数据开发工程师。

● 优势2：6项目制，2大项目实战，新增PB级内存计算项目实战，应对企业级大数据开发工程师需求。

● 优势3：研究院精心研发基于实时技术栈全新架构的出行行业和电商行业大数据项目，让学生具备更强项目经验要求。

● 优势4：最短路径教会企业最实用的技术，案例练习促进吸收；每日作业夯实学习成果；阶段项目实战，学以致用。

新增基于Flink的悠游出行大数据平台

新增基于Flink的优购电商优选项目

新增用户画像解决方案项目，包含了新零售、电商、金融保险等多行业画像解决方案

升级Spark内存计算阶段项目实战

新增大数据Java语言基础，为Flink技术栈提供语言支持

新增SQL大厂面试题，贯穿课堂每日一练，提升SQL技术能力

新增Hudi数据湖，Hudi on Hive构建湖仓一体架构

新增Python版NoSQL课程，达到企业级万亿级数据存储目标

新增Doris、ClickHouse多维数据分析

优化亿品新零售项目中数仓建模理论基础，强化数仓建模工具使用

优化车联网项目全新架构升级

优化Flink技术课程版本更新至1.16，丰富实时计算新特性

优化Spark技术课程版本更新至3.3.0，增加Spark新特性讲解

优化优化Hadoop模块，增强Hive模块

优化优化Python编程内容，为Spark提供语言支持

优化ETL项目增加从HDFS到Hive的数据抽取、转换、加载方式

优化ETL项目增加DataX数据采集

优化ETL项目增加Apache DolphinScheduler调度全流程数据处理过程

优化Flink技术栈突出以FlinkSQL为主核心技术

2022.06.01 升级版本3.0

课程名称

Python+大数据开发课程

课程推出时间

2022.06.01

课程版本号

3.0

主要针对

　　技术课程：ETL开发、NoSQL中间件课程、新版Flink课程

主要使用开发工具

PyCharm、DataGrip、FinalShell

课程介绍

● Python大数据V3.0课程全新升级，紧贴各类企业招聘需求，采用六项目制驱动技术学习，助力国家数字化转型对数字人才的大量需求

● 多位Apache社区贡献者联袂授课，从原理、实战到源码，带你迈入高级开发工程师行列

● 课程覆盖企业级大数据四大主流解决方案，包括离线数仓解决方案、用户画像解决方案、流批一体解决方案和湖仓一体解决方案，再现公司中真实的开发场景，目标不止于就业，而是成为各类企业争抢的大数据开发工程师。

● 课程升级主流大数据技术栈，全新Hadoop3.2，Spark3.2，Flink1.15技术剖析和新特性使用，推出Python全栈ETL开发课程，不仅可以学习到完整的基础ETL流程、工具，更能胜任千亿级、亚秒级等复杂数据源情况下的工作。

● 新增基于Python和SQL的Flink课程，满足就业市场中，大数据开发岗位更多的依赖SQL、Python的需求变化。

● 新增基于Python的Kafka、Elasticsearch等全新课程，夯实实时计算开发基础能力，帮助学员掌握数据开发工程师重要技能。

● 新增新版面试加强课，内容集成了大厂架构解析、SQL专项面试宝典，以及不断滚动更新的全网大数据岗位面试题讲解，助力学员高起点就业。

新增基于Python的全栈ETL开发课程，助力学员胜任ETL中高级开发岗位

新增全网基于PySpark技术栈的用户画像项目，替换原有旧项目，提升简历含金量

新增知行教育项目实战，学习完整企业级项目实战流程，让学生真正掌握大数据开发精髓

升级Spark技术课程为20223.2版本、Flink技术课程为20221.15版本，全网率先加入Pandas on Spark数据开发内容

新增FlinkSQL湖仓一体项目、FlinkSQL流批一体课程，进阶Flink高阶工程师，助力突破年薪50W

新增SparkSQL底层执行原理，StructuredStreaming结构化流内容

升级Spark3.2整合Hive3.1.2版本兼容问题

新增Pandas_udf函数，通过Apache Arrow框架优化数据处理速度；Pandas技术栈，能够处理中小型数据量

新增Python版NoSQL课程，达到企业级万亿级数据存储目标

新增Kafka-Python完成企业级消息队列流量削峰，异步通信等任务

新增ElasticSearch技术栈，达到企业级大数据搜索工程师目标

升级PySpark的DataFrame操作、Flink任务调度机制以及Flink内存模型、Flink table&sql的整体概述

新增FlinkSQL的原理和调优、Flink on Yarn的多种部署方式、Flink transformation的八大物理分区的原理和实现、Flink的window窗口操作，以及内置水印函数的操作

新增Hadoop3.x新特性、Hive3.x新特性，以及数据压缩、存储格式等内容

升级Python基础，增加PyEcharts等BI内容，实现可视化大屏

新增Presto对接多数据源实现企业级大数据OLAP分析、Presto加速对Hive数仓之上数据构建大数据分析引擎，实现多维指标计算

新增企业级BI工具FineBI，适用于多行业项目BI大屏展示，助力企业数字决策

新增Flink table&sql概念和通用api介绍、sqlclient工具的使用、catalogs知识点的学习、流处理中的概念介绍

新增FlinkSQL中的窗口使用、FlinkSQL函数操作、Flinksql连接到外部系统

新增Flink源码前置基础、源码的编译和部署、Flink启动脚本的解读、yarn-per-job模式解析

升级车联网Web展示部分、车联网离线Hive数仓构建部分

2021.06.01 升级版本2.0

课程名称

Python+大数据开发课程

课程推出时间

2021.06.01

课程版本号

2.0

主要针对

新零售数仓项目、云上服务器集群

主要使用开发工具

新零售数仓项目、云上服务器集群

课程介绍

● 经过不断的版本迭代，正式推出新零售数仓项目课程，替换原有的旧项目，打造过硬的项目实战经验

● 新增价值百万的UCcloud云上集群生产环境用于学习，完全云服务开发环境体验

● 新增项目实战环节，再现企业中真实工作场景，夯实开发实战能力

升级PySpark执行流程

新增Spark3.x新特性以及性能调优九项原则

升级Hive版本为新的3.x版本

新增自动导入oracle数据，自动创建hive表，自动创建hive分区，自动关联hdfs数据，自动创建文件目录，并记录自动化过程日志

升级Flink版本为新版

新增FlinkSQL&Table理论部分比重，使用新版API，使用新增FlinkSQL整合Kafka案例

新增美团、平安、小米大数据架构，以及百度广告业务场景大数据架构解决方案

新增flink的global window的操作、内置水印函数的操作

升级 flink的window的ReduceFunction、AggregateFunction、ProcessWindowFunction、具有增量聚合的ProcessWindowFunction、在 ProcessWindowFunction 中使用每个窗口状态

新增flink的state的ttl机制、state的数据结构的api升级、Queryable State知识点

新增Flink异步io的vertx框架实现、flink的join操作（Tumbling Window Join、Sliding Window Join、Session Window Join）

新增Streaming File Sink连接器的小文件操作

新增数据类型及序列化的原理和实现案例

新增Flink Action综合练习：热门销售排行TopN的使用案例、布隆过滤器结合TTL的使用案例

2021.01.01 升级版本1.6

课程名称

Python+大数据开发课程

课程推出时间

2021.01.01

课程版本号

1.6

主要针对

Spark3.x

主要使用开发工具

Pycharm、Idea、Datagrip、FinalShell

课程介绍

● 针对Spark3.x版本的重大更新，应对就业岗位需求的快速变化，大数据课程推出基于Python的Spark课程

● 新增大数据工程师必备的SQL面试进阶强化内容，提升大数据开发工程师核心SQL能力

● 新增大厂数仓架构专题内容，提升数据仓库建设能力

升级Hadoop为3.3.0版本、Hive版本为3.1.2版本、HIve3.x架构

新增使用Python实现MR原理机制、OLAP、OLTP区别

新增MapReduce计算PI原理、MapReduce Python接口调用、Hadoop Streaming提交程序、ETL、ELT区别

新增HIve3新特性、Hive3数据压缩，存储格式、Hive CTE表达式

升级union联合查询、Hive知识点案例同步为Hive3版本、Linux课程、Mysql RPM安装方式以支持hive3

升级Spark语言为官方推荐使用的Python语言、版本更新为Spark3.1.2发行版、adoop3.3.0、Hive3.1.2版本

新增PySpark的安装、任务提交方式、多种模式spark-submit、实现wordcount案例实战

新增Python实现RDD操作、DataFrame操作、实现Sougou分词案例、IP热度分析案例、PV-UV-TOPK案例

新增PySparkSQL实现基础统计操作、底层Dataframe转化RDD原理操作、实现电影评分数据集分析、离线教育案例、新零售分析案例

新增PySparkSQL的优化方式、分布式引擎实现、与HIve整合

2020.06.01 重磅推出 新版1.0

课程名称

Python+大数据开发课程

课程推出时间

2020.06.01

课程版本号

1.0

主要针对

大数据引入Python语言、Pandas数据分析

主要使用开发工具

Pycharm、Idea、Datagrip

课程介绍

● 8.1版本以前的数据开发课程，需要一定Java基础和工作经验，为了帮助进入数据开发行业的零基础学员找到适宜的入门途径，大数据引入Python语言，全新升级为Python+大数据开发1.0版本。

● 学习Python大数据开发，以Python技术栈处理中小型数据集，以大数据技术栈处理海量大规模数据，成为全能企业级数据开发人才。

● 其特点适合零基础学员，从完全没有编程经验开始；课程内容宽并且深，技术大牛亲自授课；面向市场，学即可用，能让学员高薪就业。

新增Python基础语言课程

新增Python高级语言进阶课程

新增Python爬虫课程

新增Pandas数据分析课程

新增多场景案例分析，应对中小型数据统计分析

2020.01.01 升级版本8.0

课程名称

云计算大数据实战班

课程推出时间

2020.01.01

课程版本号

8.0

主要针对系统

Windows、Linux、MacOS

主要使用开发工具

DataGrip、IDEA

课程介绍

● 根据大量的行业调研分析，本次课程更新以大数据开发为主线，在7.0基础上再次缩减Java课程占比，弱化各类组件安装。

● 针对大数据技术深度和广度进行升级，例如新增Spark内存管理、Flink性能优化及反压、背压原理等同时为提高学员的就业薪资，推出多行业项目解决方案，例如证券、物流等。

● 以周为单位进行课程更新升级，新增Elastic Stack、出行、电商、视频、社交等领域大数据解决方案、一线大厂技术架构、新零售大数据项目实战，离线实时全覆盖。

新增数据仓库、ETL、BI开发

新增Oracle及PLSQL编程、数据微服务开发

新增Spark的内存管理、avro序列化数据源

新增continuous processing、偏移量管理机制

新增KafkaStreams编程、exactly-once、Kafka事务、metrics监控

新增Hbase的协处理器和phoneix的二级索引实现、布隆过滤器、LSM树、StoreFiles结构剖析

新增FLink性能优化及反压、背压指标计算原理、FlinkSQL On Hive、Flink HistoryServer、Flink的UDF、UDAF、UDTF的实现

新增在线教育行业、物流行业、物联网行业、证券行业项目

升级分布式缓存系统，万亿级NoSQL海量数据存储，分布式流处理平台、电商行业项目

删除删减 JavaWeb

2019.07.22 升级版本7.0

课程名称

云计算大数据实战班

课程推出时间

2019.07.22

课程版本号

7.0

主要针对版本

CDH5.14、Spark2.2.0、Flink1.8、Kafka0.11.0.2、ELK6.0

主要使用开发工具

IntelliJ IDEAA

课程介绍

● 大数据技术目前在企业里面使用的越来越广泛，对大数据人才的需求越来越多，大数据的整个课程体系是由来自大型互联网、外企等具有5年以上的一线大数据高级工程师、架构师和高级机器学习工程师设计出来的，内容含金量非常高。

● 课程体系涉及的技术以企业需求为导向，课程涉及的项目也是企业里面真实的项目，通过理论、实践和真实的项目相结合，让学员能够快速、深刻的掌握大数据常用的核心技术和开发应用，同时可以满足企业对中、高端大数据人才的需求。

● 大数据课程体系除了包含常用的Hadoop、Hive、Hbase、ELK、Sqoop、Flume、Kafka、Spark等技术和项目，还新增了目前互联网比较流行的Flink、Druid、Kylin等技术和项目，同时引入了机器学习和深度学习Spark Mllib和Tensorflow等技术和项目实战。

新增Impala即席查询组件、Kudu列存储服务、Structured Streaming结构化数据流处理

新增spark MLlib数据挖掘、spark graphX图计算

升级Flink的基础课程和案例实战

新增Flink高级特性CEP、Kylin数据OLAP分析、Druid时序数据实时分析、Kettle数据ETL工具

新增深度学习框架Tensorflow

新增用户画像、数据仓库大型企业实战型项目

2018.09.10 升级版本6.0

课程名称

云计算大数据实战班

课程推出时间

2018.09.10

课程版本号

6.0

主要针对版本

JDK1.8\CDH2.7.4\Storm1.1.1\Spark 2.1

主要使用开发工具

IntelliJ IDEA

课程介绍

● 本课程是基于V5.0的一次重大更新，汇总并收集了大数据学科一年以来15个零基础班级的授课信息、学习信息、就业信息。

● 重新调整了课程的分布情况，新增了大数据综合项目，新增了第四代大数据处理框架FLink，新增了数据库优化，新增了JVM基础及原理，新增了Spark性能调优等内容。

● 课程升级方面，主要对机器学习课程进行了升级，推荐系统项目后置变成7天的丰富课程，提升学员进入机器学习的竞争力，从而更好的从事人工智能领域相关的工作。

● 整体而言，课程在培养中高级大数据工程师的方向上又前进了一大步。

新增Hadoop 2.7.2\Storm1.1.1\Spark 2.1

新增Java virtual machine原理分析、Java高并发核心知识

新增数据库优化及调优、第四代大数据处理框架Apache Flink、Spark原理深入剖析及生产调优

新增互联网反欺诈项目实战、广告系统业务模型及CTR预估

新增用户画像、数据仓库大型企业实战型项目

升级用户画像概述/数据/建模/算法实战、推荐系统协同过滤算法实战、基于内容的推荐系统实战、基于关联规则推荐系统实战

升级混合推荐与CTR点击预估

升级Hadoop版本为CDH

2017.07.01 升级版本5.0

课程名称

云计算大数据实战班

课程推出时间

2017.07.01

课程版本号

5.0

主要针对版本

JDK1.8\Hadoop 2.7.2\Storm1.1.1\Spark 2.1

主要使用开发工具

Eclipse、IDEA

课程介绍

● Java基础、JavaWeb核心编程、JavaWeb三大框架、网络爬虫、分布式电商网站开发等课程模块。培养学生编程能力，让零基础学员能够更好的学习大数据项目。

● 大数据方面方面，新增点击流日志收集系统、用户日志分析报表系统、用户画像系统等案例。让学员不仅仅学习到大数据技术点，能够使用大数据解决实际问题。

● 扩充机器学习课程为10天。该课程历时一年研发，深入浅出，能够让学员更好的入门机器学习，成为人工智能开发的初级工程师。

升级Hadoop 2.7.2\Storm1.1.1\Spark 2.1

新增网络爬虫开发

新增三大框架开发

新增JavaWeb核心

新增Java语言基础

2016.03.01 升级版本4.0

课程名称

云计算大数据实战班

课程推出时间

2016.03.01

课程版本号

4.0

主要针对版本

JDK7.x

主要使用开发工具

Eclipse、IDEA

课程介绍

● 对比原有课程，本次课程做了重大更新，将大数据的核心技术hadoop及其生态圈技术完美的融入到了课程中。

● 课程分阶段的进行案例实战和项目实战，在大数据方面知识体系更加完整，课程更加深度有深度，更加贴近实战。

● 分阶段的进行大数据生态圈的学习，将生态圈分为离线处理，实时流计算和实现火热的spark内存计算，完美的将生态圈进行了抽离和归类，让学习变得更便捷。

升级Spark1.6版本

新增Linux操作系统和shell脚本学习

新增JVM内存模型分析、NIO、Netty、自定义RPC框架

新增电商点击流日志分析、电商实时日志告警平台、交易风控风控平台、流量日志分析分析

新增Spark游戏日志分析项目

删除KVM虚拟化技术、网络基础和OpenvSwitch技术、Ceph存储技术

删除CloudStack云管理平台、混合云管理平台项目

2015.05.15 升级版本3.0

课程名称

云计算大数据实战班

课程推出时间

2015.05.15

课程版本号

3.0

主要针对版本

JDK7.x

主要使用开发工具

Eclipse、IDEA

课程介绍

● 本次更新将大数据和虚拟化这两大热门技术加入到课程体系中，在大数据方面知识体系更加完整，课程更加深度有深度，更加贴近实战。

● 在虚拟化方面，选择了在云计算领域常用的虚拟化、网络、存储等技术，并通过Apache CloudStack技术整合，在此基础上开发混合云管理平台。

升级Hadoop2.0版本、Hive优化课程

新增电信流量运营分析项目、混合云管理平台项目

新增Scala函数式编程、Spark内存计算、KVM虚拟化技术

新增网络基础和OpenvSwitch技术

新增Ceph存储技术、CloudStack云管理平台

2014.02.15 升级版本2.0

课程名称

云计算大数据实战班

课程推出时间

2014.02.15

课程版本号

2.0

主要针对版本

JDK6.x

主要使用开发工具

Eclipse

课程介绍

● 随着近年来云计算大数据的大力发展，市场对相关人才需求急增，所以本版课程在原有的云计算课程进行了颠覆性的改革，把原来只有1天的课程扩展为7天，加入了Hadoop生态圈的相关技术。

升级云计算课程、Hadoop集群部署、优化HDSF、MapReduce案例

新增Hadoop生态圈相关技术：Zookeeper、Hive、Hbase、Sqoop、Flume

新增Storm实时计算技术和案例

新增黑马论坛日志分析项目

2012.02.15 升级版本1.0

课程名称

云计算大数据实战班

课程推出时间

2012.02.15

课程版本号

1.0

主要针对版本

JDK6.0

主要使用开发工具

Eclipse

课程介绍

● 近期云计算概念火爆异常，传智教育敏锐的嗅探到大数据技术的悄然兴起，并预测大数据技术将会像雨后春笋一样快速发展，所以传智教育与时俱进在课程中引入了1天的云计算课程，作为拥有大数据课程的培训机构，传智教育大数据实战班助力学员可以掌握新的技术，拓宽学员的就业方向，增强就业竞争力。

新增云计算课程：云计算和大数据相关概念

新增Hadoop 1.0伪分布式环境部署

新增HDFS、MapReduce应用案例

大数据开发入门1

阶段案例实战

大数据核心基础2

千亿级数仓技术3

阶段项目实战

数据分析技术4

阶段项目实战

PB级内存计算5

阶段项目实战

亚秒级实时计算6

阶段项目实战

大厂面试7

黑马程序员AI大数据开发课程优势

基于StarRocks的统一数仓平台

流批一体数仓解决方案

一站式数据治理解决方案

阿里云一站式云端解决方案

数据分析

收集、整理和分析数据，提供数据报告和业务建议

技术要求：熟练使用数据分析工具，理解业务需求，具备良好的沟通能力

数据开发

负责大数据平台的搭建与维护、数据采集与处理、数仓设计与开发、性能优化等工作

技术要求：需具备大数据技术栈应用、数据处理、数据库应用、数仓开发等技能

数据挖掘

负责利用机器学习算法，从大量数据中提取有价值的信息，并基于此进行分析和预测

技术要求：数据挖掘工程师需具备Python、数据处理、机器学习等多方面技能

AI+Python大数据开发课程大纲

查看详细课程大纲课时:8天技术点:60项测验:1次学习方式:线下面授

查看详细课程大纲课时:13天技术点:8项学习方式:线下面授

查看详细课程大纲课时:11天技术点:105项学习方式:线下面授

查看详细课程大纲课时:4天技术点:40项学习方式:线下面授

查看详细课程大纲课时:4天技术点:40项学习方式:线下面授

查看详细课程大纲课时:7天技术点:80项 测验:1次 学习方式:线下面授

查看详细课程大纲课时:8天技术点:100项 学习方式:线下面授

查看详细课程大纲课时:10天技术点:80项 测验:1次 学习方式:线下面授

查看详细课程大纲课时:12天技术点:100项 学习方式:线下面授

查看详细课程大纲课时:2天技术点:40项 学习方式:线下面授

查看详细课程大纲课时:5天技术点:30项 测验:1次 学习方式:线下面授

查看详细课程大纲课时:6天技术点:80项 测验:1次 学习方式:线下面授

查看详细课程大纲课时:7天技术点:80项 学习方式:线下面授

查看详细课程大纲亚秒级实时进阶课（免费赠送）课时：8天

提升职场竞争力 实力加倍

基于FineReport的BI项目NEW

企业级真实新零售大数据项目NEW

基于流批一体架构的新零售大数据项目NEW

出行行业流批一体数据仓库NEW

基于阿里云的出行大数据项目NEW

赵老师

张老师

曹老师

孔老师

赵老师

宋辛童(五藏)Apache Flink Committer，阿里巴巴技术专家，北京大学博士

李岗ASF Member，Apache DolphinScheduler PMC

代立冬白鲸开源联合创始人、Apache 孵化器导师，Apache DolphinScheduler PMC Chair& Apache SeaTunnel PMC、ApacheCon 亚洲大数据湖仓论坛出品人，中国开源先锋

更多>>AI大数据开发学科动态

更多>>AI大数据开发技术资讯

更多>>AI大数据开发培训常见问题

AI大数据开发课程体系V5.0

数据库基础入门试学班 1

学习目标

主讲内容

Hadoop技术栈高手班 1

学习目标

主讲内容

千亿级离线数仓项目高手班 2

学习目标

主讲解决方案

主讲知识点

千亿级离线数仓实战高手班 3

学习目标

主讲解决方案

主讲知识点

BI报表开发项目实战高手班 4

学习目标

主讲解决方案

主讲知识点

Python基础编程高手班 5

学习目标

主讲内容

黑马程序员
AI大数据开发
课程优势

基于StarRocks的
统一数仓平台

流批一体数仓
解决方案

一站式数据治理
解决方案

阿里云一站式云端
解决方案

查看详细课程大纲课时:7天技术点:80项测验:1次学习方式:线下面授

查看详细课程大纲课时:8天技术点:100项学习方式:线下面授

查看详细课程大纲课时:10天技术点:80项测验:1次学习方式:线下面授

查看详细课程大纲课时:12天技术点:100项学习方式:线下面授

查看详细课程大纲课时:2天技术点:40项学习方式:线下面授

查看详细课程大纲课时:5天技术点:30项测验:1次学习方式:线下面授

查看详细课程大纲课时:6天技术点:80项测验:1次学习方式:线下面授

查看详细课程大纲课时:7天技术点:80项学习方式:线下面授

提升职场竞争力实力加倍

AI大数据开发 V版本课程说明