AI导航网

栏目导航

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

大数据发展里程-Hadoop视角

时间：2022-09-01分类：NoSQL作者：编程之家原文地址

周末查询了一些大数据相关的资料，今天简单以Hadoop的视角来总结一下我对大数据发展里程的总结：

2004：Google 发表大数据论文， “三驾马车”横空出世

分布式文件系统 GFS
大数据分布式计算框架 MapReduce
NoSQL 数据库系统 BigTable

2006：Nutch 搜索引擎分离出 Hadoop

Doug Cutting 将大数据相关的功能从 Nutch 中分离出来

HDFS，分布式文件存储
MapReduce，分布式计算引擎、资源调度框架

2007：陆续应用于雅虎、百度、阿里等企业

Hadoop 应用于互联网大厂的大数据存储与计算

2008：Hadoop 成为 Apache 顶级项目

Cloudera 成立，运营 Hadoop 的商业公司
Pig（Yahoo 开发）脚本语言转换为 MapReduce 任务
Hive （Facebook 开发）用 SQL 转换为 MapReduce 任务
Cassandra （Facebook 开发）分布式 NoSQL 数据库

2011：Hadoop 生态逐步形成

Sqoop 数据导入、导出工具
Flume 日志分布式收集、聚合、传输
Oozie 工作流调度引擎
HBase 基于 HDFS 的 NoSQL 系统
Cassandra 分布式 NoSQL 数据库，逐渐流行

2012：Yarn 资源调度系统

Spark 开始崭露头角：源于伯克利 AMP 实验室。

新概念引入：

批处理计算、大数据离线计算

代表：MapReduce、Spark

大数据流计算、大数据实时计算

代表：Storm、Flink、Spark Streaming

大数据分析与大数据仓库

代表：Hive、Spark SQL

大数据挖掘与机器学习

代表：Mahout、MLlib、TensorFlow

本次总结粒度比较粗，面相对窄。后续我们继续

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

SSM+校园网上订餐系统毕业设计-附源码211510

校园网上订餐系统系统主要功能模块包括公告内容（公告栏、轮播图）用户管理（管理员、普通用户）、内容模块（资讯分类、资讯列表）、模块管理（菜品分类、菜单、订单表），采取面对对象的开发模式进行软件的开发和硬...

【SpringBoot项目】SpringBoot项目-瑞吉外卖【day01】

从今天开始，正式进入项目阶段。本次的项目是跟着黑马的瑞吉外卖项目走的，有借鉴和使用，也有自己的观点和实现。由于本课程用到了很多前端知识（了解），所以关于前端分析的时候，我应该会选择跳过或者简略一看；大...

软件测试的行业现状，我们的未来在哪里？

在可预见的将来，IT不会萎缩，只会越发展越庞大，最终会渗透到人类社会的每一个角落。在这个过程中会不断地产生新的领域和新的机会，我们则需要在这个风口上抓住机会。从技术层面来说，吃透测试理论和方法，掌握最少...

vulntarget-b靶场详细通关记录

vulntarget-b靶场最详细通关记录。

Navicat远程连接MongoDB最全解决方法教程、报错

MongoDB是一个开源、高性能、支持海量数据存储的。

【NoSQL数据库技术与应用】【课本代码】【课后题答案】【持续更新】

【NoSQL数据库技术与应用】课本代码、课后答案（持续更新）

MongoDB 的安装详细过程

MongoDB 的安装详细过程

什么是NoSQL？随着这次训练就来学习一下

学习一下什么是Nosql

Redisredis 简介redis 采用的是单线程的 KV 模型，由 C 语言编写，1. Redis 中的事务？2. Redis 中的数据结构3. Redis 中如何保证缓存和数据库双写时的数据一致性？4. 如何使用 Redis 做异步队列和延时队列？5. Redi...

10题经典Redis面试题

Redis必背面试题

小编推荐

热门标签