sparklyr - 编程之家

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

sparklyrsparklyr专题提供sparklyr的最新资讯内容，帮你更好的了解sparklyr。

使用sparkly.nested中的sdf_nested来按组拟合多个回归模型问题

<h1>背景</h1> 我有兴趣使用<a href="https://rdrr.io/cran/sparklyr.nested/man/sdf_nest.html" rel="nofollow noreferrer"><code>sdf_ne

作者：佚名时间：2022-07-24

sparklyr不创建执行程序

我正在尝试使用以下参数创建火花连接： <pre><code>library(sparklyr) conf <- spark_config() conf$`sparklyr.cores.l

作者：佚名时间：2022-07-30

使用sparklyr在R中调用Spark窗口函数

我一直在尝试在sparklyr中复制以下pyspark代码段，但没有运气。 <pre><code>from pyspark.sql.window import Window fr

作者：佚名时间：2022-06-12

SparkR和Sparklyr之间导入镶木地板文件所花费的时间差

我正在使用<code>SparkR</code>和<code>sparklyr</code>在数据块中导入镶木地板文件。 <code>data1 = SparkR::read.d

作者：佚名时间：2022-06-12

有没有办法在Sparklyr中使用ml_linear_regression显示标准错误？

使用sparklyr运行线性回归时，例如： <pre><code>cached_cars %>% ml_linear_regression(mpg ~ .) %>% summary() </co

作者：佚名时间：2022-06-12

在数据砖中使用Sparklyr查找日期列的最大值

我只是想使用在databricks中使用sparklyr导入的数据来查找日期列的最大值： <code>data %>% dplyr::select(

作者：佚名时间：2022-06-12

Sparklyr-无法连接到“本地”

当尝试使用sparklyr连接到spark时，出现以下错误消息： <pre><code>'Error in spark_connect_gateway(gatewayAddress,

作者：佚名时间：2022-06-11

在Databricks中使用Sparklyr进行因子分析

我想通过在<code>Factor Analysis</code>中使用<code>dplyr::collect()</code>来执行<code>Databricks</code>，但是由于它的大

作者：佚名时间：2022-06-11

在Databricks中使用Sparklyr注册临时表

我的同事在<code>pyspark</code>中使用<code>Databricks</code>，通常的步骤是使用<code>data = spark.read.format('delta&#

作者：佚名时间：2022-06-11

在Databricks中使用Sparklyr收集表

我有一个<code>parquet</code>表，大约有<code>5 billion rows</code>。使用<code>sparklyr</code>进行所有操作后，它会减

作者：佚名时间：2022-06-11

设置spark.yarn.dist.archives时未分发存档文件

我正在使用Sparklyr 1.4.0，并试图将打包的Conda R环境分发给所有工作人员。这是我的配置： <pre><code>conf

作者：佚名时间：2022-06-11

SparkR中的StringInderxer和一种热编码

我正在尝试通过使用一种热编码概念并在以下代码上使用stringindexer将SparkR中的字符串变量转换为数字：

作者：佚名时间：2022-06-10

计算Sparklyr中的累积和

如何计算Sparklyr中的累积总和？ dplyr： <pre><code>iris %>% group_by(Species) %>% mutate(col = cumsum(Sepal.

作者：佚名时间：2022-06-09

语法以计算字符数Spark R

在R中，我们使用str_length（）进行相同操作，Spark R中类似操作的语法是什么。 R语法 <pre><code>doc

作者：佚名时间：2022-06-09

repxi，length.out = nvar中的错误：尝试复制“ S4”类型的对象

我无法对两个数据框进行解析。我使用另一个数据框创建了一个，像这样，data1是我的原始数据框

作者：佚名时间：2022-06-09

当我尝试导入.parquet文件时，为什么R给我“错误：org.apache.spark.sql.catalyst.errors.package $ TreeNodeException：执行，树：”？

我需要管理一个传感器在5个月内检测到的数据，我要处理30根色谱柱，需要5秒的采样时间，所以检测量

作者：佚名时间：2022-06-09

在Hive中加载预分区数据以供Sparklyr使用

我是蜂巢的新手，希望能得到一些帮助。我正在遵循<a href="https://spark.rstudio.com/examples/yarn-cluster-emr/" rel="

作者：佚名时间：2022-06-08

Sparklyr中的完整数据框

我正在尝试在sparklyr中复制<code>tidyr:complete</code>函数。我有一个缺少某些值的数据框，我必须填写这些行

作者：佚名时间：2022-06-08

汇总标准差并计算Sparklyr中的非NA无NA

我有一个很大的data.frame，并且我一直在使用<code>summarise</code>和<code>across</code>来汇总众多变量的摘要统

作者：佚名时间：2022-06-07

我对<code>top_n()</code>和<code>scale_head()</code>的尝试均因错误而失败。 <a href="https://github.com/tidyverse/dpl

作者：佚名时间：2022-06-06

小编推荐

苹果市值2025年有望达4万亿美元