apache-spark-sql - 编程之家

apache-spark-sqlapache-spark-sql专题提供apache-spark-sql的最新资讯内容，帮你更好的了解apache-spark-sql。

好吧，所以我试图将数据库从pyspark写入到蔚蓝的sql数据库，但是遇到日期时间超出范围值的问题。我知

以下程序运行一个简单的字数来测试Spark结构化的流。我在终端上写单词，然后在另一个终端上运行程序

在Pyspark中，我使用以下格式的数据框火花： <pre><code>CODE | TITLE | POSITION A | per | 1 A | eis

例如假设我有<code>List<String> setOfPrefixes</code> 现在，我想扫描所有前缀并存储在一个JavaRDD中。该怎

我正在读取使用AWS DMS服务从MySQL表生成的镶木地板文件。该表具有一个类型为Point（WKB）的字段。当我读

我正在努力将Spark中的以下xml解析为<code>ID</code>和<code>NAME</code>列的数据帧。 <pre class="lang-xml prettyprint

我有两列类型为<code>Map[String, Integer]</code>的列，我想使用<code>withColumn</code>添加一列来表示两张地图的相

我有一个包含3列的主表“表1”（如下所示）。表2.1、3.1和4.1针对表1中存在的3个唯一日期，需要在“要

我正在使用GeoSpark 1.3.1，试图在其中查找POLYGON中包含的所有地理位置。我使用sql命令： <pre><code>val res

以下oracle SQL命令是单行简短命令，用于将整数转换为值的字符串表示形式。 <br/> <br/> <code> Select DECODE(emp

我目前正在将基于Spark的服务从2.4.5迁移到3.0.0。我注意到，在<code>partition</code>值的数据类型上应

我正在尝试按livy POST api（/ sessions /：sessionId / statements）提交火花作业。但是，在提交35条以上的语句（

给我两个数据库A和B。A的列名为A1，A2，A3 ... B的列为B1，B2，B3 ...直至B200。 A3类型为二进制，此二

我在Databricks平台上运行一些代码，遇到了一个超级杂乱的问题，即同一数据框返回的结果不一致。这是

以实木复合地板格式将数据帧写入s3时，出现以下错误： <pre><code>Py4JJavaError: An error occurred while calling

我正在尝试使用pyspark将列的字符串值（例如<code>D20200910.T000000</code>）解析为日期格式。我尝试了以下操

这是我的数据框： <a href="https://i.stack.imgur.com/Vptho.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.

我有一个表必须在其中一个列中可能包含非ASCII字符的条件。我必须检测（而不是替换）该列是否具有

我正在从Oracle数据库获取数据，并使用Spark作业将其写入PostgreSQL数据库。对于一张表，由于数据UTF

我有下面的配置单元表和以下数据，我试图通过组合聚合函数来查找每个实例和名称组合的lowerbound（MAX

分类导航