AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

MongoDB Hadoop Connector

程序名称：MongoDB Hadoop Connector

授权协议: Apache

操作系统: 跨平台

开发语言: Scala

MongoDB Hadoop Connector 介绍

Hadoop擅长分析和处理大型数据集，而MongoDB擅长存储应用程序的大型数据集，这两者结合到一起，就诞生了Mongo-
Hadoop——MongoDB主要负责存储和查询，Hadoop主要负责批处理。

Mongo-Hadoop可以很容易地使用Mongo数据库库以及.bson格式的mongoDB备份文件，并将此作为Hadoop
Map/Reduce任务的数据输入源或者输出目标。Mongo-Hadoop先检测数据并计算数据分割，然后交给Hadoop并行处理，这样非常大的数
据集就可以快速被处理。

Mongo-
Hadoop支持 Pig和Hive，这两个开源项目允许编写非常简单的脚本来执行非常复杂的MapReduce工作流。

Mongo-Hadoop还支持Hadoop streaming，这样你可以使用Java以及其他任何编程语言来编写map/reduce函数。目前Mongo-
Hadoop支持Ruby、Node.js和Python中的streaming。

Mongo-Hadoop的工作流程如下：

Mongo-Hadoop首先检查MongoDB Collection，并计算数据分割
每个分割部分被分配到Hadoop集群中的一个节点
同时，Hadoop节点从MongoDB（或BSON）获取数据，并进行本地处理
Hadoop合并结果，并输出到MongoDB或BSON

介绍内容来自 iteye

MongoDB Hadoop Connector 官网

https://github.com/mongodb/mongo-hadoop

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

分布式应用网格

相关推荐

Memcached Session Manager

memcached-session-manager 将session存储到memchached实现方案时。他主要功能是修改tomcat的session存储机制，使之能够把session序列化存放到memcached中。

作者：编程之家时间：2021-10-21

Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作，以提升性能。

作者：编程之家时间：2021-10-21

EasyTomcat 是一个用来帮助简化 Tomcat 和MySQL 管理的系统，你可以启动、停止和配置 Tomcat和MySQL

作者：编程之家时间：2021-10-21

riak-session-manager

riak-session-manager 是使用 Riak 来存储Tomcat session 信息的项目。配置方法：

作者：编程之家时间：2021-10-21

tomcat-redis-session-manager

tomcat-redis-session-manager 是一个用来将 Tomcat 的 Session 数据存储在 Redis 库中的项目。

作者：编程之家时间：2021-10-21

Tomcat Extensions for JDeveloper 11g

这是一款在 Oracle 的 JDeveloper 开发环境下管理Tomcat 的插件，如下图所示：

作者：编程之家时间：2021-10-21

扩展Tomcat 6.x，使用redis存放session信息!是一个Eclipse项目,最好用EGit来Clone(因为里面有个中文文件名的说明文件).

作者：编程之家时间：2021-10-21

dhcpcd 是一个兼容 RFC2131的DHCP客户端程序，支持DHCP的全部功能并且体积非常小，只有差不多 46k。

作者：编程之家时间：2021-10-21

phpDHCPAdmin 是一个基于 Web 的动态主机配置协议(DHCP Daemon)的管理工具，可单独设置组、用户级别；PXE、多子网；空间租赁管理功能。可对数据进行可视化展示、分类。适合大规模的 dhcpd 环境管理。

作者：编程之家时间：2021-10-21

JDHCP 项目的目的是为 Java 应用增加简单操作 DHCP 协议的方法，DHCP是动态主机配置协议的简称。使用这个API可以轻松的发送、接收和解析DHCP消息，可用于编写DHCP的客户端、服务器端应用。

作者：编程之家时间：2021-10-21