apache-spark-sql - 编程之家

apache-spark-sqlapache-spark-sql专题提供apache-spark-sql的最新资讯内容，帮你更好的了解apache-spark-sql。

我想根据字典值替换 <code>col(unit)</code> 字符串。如果 <code>col(unit)</code> 字符串包含<strong>元组键的所有

我想创建一个返回 False 或 True 到特定条件的数据框，它将替换 Pandas 中的内置函数 <code>.all</code>。我提

我有一个类似于下面的数据： <pre><code>Col1,col2,col3 a,1,# b,2,$ c,3,% </code></pre> 我需要创建一个新列，

我有一个包含两个数组列的数据框，如下所示： <pre><code>Arrayed_Column_1 [{"ID":222222,"No":2},{&#

谁能用清晰的例子解释数组和包裹数组的区别。我浏览了互联网，但没有得到关于差异的明确细节

在这里，我正在为 spark.sql 编写 SQL 语句，但我无法将 WEEKOFYEAR 转换为一年中的第几周并在输出中获得空

<a href="https://i.stack.imgur.com/ZkCNd.png" rel="nofollow noreferrer">actual code</a> <pre><code>'use strict'; const {

我第一次在Spark Scala中使用kudu。我使用spark在kudu的表中插入数据并检查其性能，我使用了1M条记录。以下

我有数字，例如键，值<code>(1,2),(3,4),(5,6) ,(7,8),(9,10),(2,11),(4,12),(6,13),(8,14),(14,19)</code> 我的输入是<co

我在Java8上使用<code>spark-sql-2.4.1v</code>。我有如下的场景/摘要 <pre><code>Dataset<Row> df =//loaded d

例如，我有一个表客户，其中有一个列<code>name</code>和一个列<code>last_name</code>。我想将这两列连接

我有一个很大的实木复合地板文件（超过30m条记录），其中包含唯一的ID（条形码）字段。我有一个ID子

我使用这个udf： <pre><code>mincol = F.udf(lambda row: cols[row.index(min(row))], StringType()) df = df.withColumn("mycol&#3

这是我先前的问题<a href="https://stackoverflow.com/questions/63586341/how-to-distribute-values-when-prior-rank-is-zero">How to di

我想知道是否有一种方法可以通过Pyspark计算每月抵押付款。换句话说，如果我的总期限为360年，抵押30

我正在尝试读取Spark 3.0.0中的ORC Hive表，该表已在同一集群中与Spark 1.6一起读取，没有任何问题。我正在

我需要计算<code>col(current_month) / previous(month) partitioned by id</code>的问题是数据不连续，所以我无法执行<cod

我正在使用以下代码从数据块中的数据帧创建表，并遇到错误。 <pre><code>df.write.saveAsTable("newtable&#3

我最近遇到了这个<a href="https://www.youtube.com/watch?v=6zg7NTw-kTQ&t=1431s" rel="nofollow noreferrer">talk</a>的关于在S

我目前有一个这样的数据框： <pre><code>+-------+-------+-------+-------+ | Id |value_list_of_dicts | +-------+-----

分类导航