cloudera专题提供cloudera的最新资讯内容,帮你更好的了解cloudera。
我在 hive 中有以下查询,以获取每个列(集群、国家和航空公司)的计数百分比。但我的百分比列只包
我正在运行一个 MapReduce 作业,该作业将只有 Mapper 阶段(无 Reducers)的 JSON 文件输出到 HDFS,处理大约 1
我有一个使用 hortonworks 的 ambari 的生产集群。现在 cloudera 已经阻止了对 hdp 存储库的所有访问,因为需
我想在 Hive 中查找表的使用情况。有没有办法至少找到配置单元表的读写计数? 我试过 <code>hadoop -fs -sta
我正在编写查询以显示特定年份的数据条目。日期存储在 dd/mm/yyyy hh:mm:ss 中。(日期 <strong>TIMESTAMP</strong
你们能帮助我进行 DSN 配置吗?出于某种原因,我不明白我在哪里遗漏了一些这不起作用的点? <pre><c
我的要求是:触发 http get 方法并读取 xml,然后将其加载到雪花舞台表中。我能够使用 InvokeHTTP nifi 处理
我们发生了一个事件,一些未知的application_id消耗了大量资源,整个hadoop集群都被警报了。 我正在
我正在运行 sqoop 命令以从 Oracle 表中导入数据。我收到下面提到的错误。我应该检查哪些项目? 如果您
使用 accumulo 1.7.4 和 cloudera HDFS 在 AWS 上进行海量数据摄取(多 TB 数据摄取)。 我没有看到大量的
我们有一个 13 节点的 nifi 集群,大约有 5 万个处理器。 flow.xml.gz 的大小约为 300MB。调起13个节点的Nifi集
我在使用 Cloudera Manager 试用版安装 CDP 7.1.4 运行时时遇到主机错误时安装失败。为此,我启动了两个 VM(
我最近向具有复制因子 2 (3.0.0) 的机架感知 HDFS 集群添加了几个新数据节点。 所有其他预先存在的
我有一个基于Hadoop的环境.我在此系统中使用Flume,Hue和Cassandra.如今,围绕Docker进行了大肆宣传,因此想了解一下在这种情况下Docker化的优缺点.我认为它应该更具可移植性,但是只需单击几下即可使用Cloudera Manager进行设置.是更快还是为什么值得?有什么优势?也许应该只对多节点Cassandra集群进行dockeri
我正在基于Docker的环境中规划多节点Hadoop集群的阶段.所以它应该基于轻量级易用的虚拟化系统.当前架构(关于文档)包含1个主节点和3个从节点.该主机使用HDFS文件系统和KVM进行虚拟化.整个云由Cloudera Manager管理.此群集上安装了多个Hadoop模块.还有一个NodeJS数据上传服务.这次我应该建立基于Docker的架构.我已阅读了
概述 准备条件 系统环境配置 安装Java 安装MySQL 安装CM CM配置 Q&A 参考 概述 最近公司需要研究大数据方向的内容,经初步讨论,决定使用CDH版本 的Hadoop,使用Cloudera生态下的Cloudera Manager平台。CDH(Cloudera’s Distribution, including Apache Hadoop),是Hadoop分支中的一种,由Clouder
我最近在 http://www.cloudera.com上下载了“QuickStart VM” (确切地说,是virtualbox的版本) 这个虚拟机使用centOS(我的电脑是macbook air) 我无法完全启动这个虚拟机(我不知道为什么) 我附上了最先进的启动状态的屏幕截图 我发现当你的屏幕看起来在那个位置被冻结时,按下[ESC]显然是你接下来应该做的. 我在那里,坐在那里几分钟,我点击e
一,虚拟机 1,vSphere安装 在服务器上裸装vSphere6.0.0,在本机windows安装vSphere Client 2,ubuntu14.04单节点安装 在vSphere上新建1台虚拟机。之后安装ubuntu14.04完成后,注意将光驱配置修改为“客户端”配置,之后按enter继续完成ubuntu的安装。 进入系统后,修改/etc/network/interfaces ,之后重启网络
第一步:准备3台虚拟机 cloudera-scm server 内存分配4G cloudera-scm agent  内存分配2G cloudera-scm agent  内存分配2G 分别修改虚拟的hostname和hosts文件 指令:sudo vim /etc/hosts 127.0.0.1 localhost #127.0.1.1 ubuntu-14.04-Serve
我在Livy Server中执行一个语句,使用HTTP POST调用localhost:8998 / sessions / 0 / statements,具有以下正文 { "code": "spark.sql(\"select * from test_table limit 10\")" } 我想以下列格式给出答案 (...) "data": { "application/json": "