Hadoop
大数据平台简介-CDH,HDP
Hadoop-1-生态圈的组件大体介绍
Hadoop-2-hadoop的HA搭建
hdfs
Hadoop-HDFS基本概念介绍(设计思路,架构,优缺点)
Hadoop-HDFS四大机制和两大核心以及元数据合并
Hadoop-HDFS-读写流程详解
Hadoop-HDFS的shell操作
mapreduce
Hadoop-Mapreduce的框架组成和运行流程
Hadoop-MapReduc入门(代码编写流程,运行流程,并行度决定机制)
Hadoop-MapReduc Shuffle过程
Hadoop-MapReduc 和 Spark的比较
Hadoop-Mapreduce数据倾斜与优化(小文件合并)
Hadoop-Mapreduce参数调优
yarn
Hadoop-Yarn介绍以及作业提交流程
hive
Hadoop-Hive基础整理(架构以及存储)
Hadoop-Hive 内部表/外部表 分区表/分桶表区别
Hadoop-Hive的数据倾斜以及优化策略
Hadoop-Hive基本使用
Hive中自定义UDF,UDTF实例以及三种自定义函数的区别
hbase
HBase的rowkey的设计原则
flume
Hadoop-Flume整理(架构,组件以及三种形式)
kafka
azkaban
sqoop
Sqoop的介绍(导入导出原理)
Sqoop的常用命令(导入导出命令)
spark
Spark-DataFrame、DataSet、RDD的区别
Spark任务运行过程解析
Spark的Shuffle的四种机制以及参数调优
spark调优之数据倾斜以及解决
spark调优-开发调优
jvm
JVM内存结构,垃圾回收算法,垃圾收集器,jvm参数配置以及常用的分析工具
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。