aws-glue-data-catalog - 编程之家

aws-glue-data-catalogaws-glue-data-catalog专题提供aws-glue-data-catalog的最新资讯内容，帮你更好的了解aws-glue-data-catalog。

在我们的前提环境中，JSON为贷款数据生成并使用一个核心加密罐进行加密，并且此加密的JSON被保存到mys

我当前的用例是，在基于ETL的服务中（<code>NOTE</code>：ETL服务未使用Glue ETL，它是一个独立的服务），我

嗨，我有一个配置单元外部表，该表使用AWS胶水作为数据目录.EMR可以访问胶水目录。我已经通过蜂巢控

我想知道是否有一种方法可以使用Glue ETL作业来扁平化深度嵌套的JSON？它具有嵌套数组。我试图在JSON上

<a href="https://i.stack.imgur.com/RNEIu.png" rel="nofollow noreferrer">Image showing tables created. (crawler snapshot) </a> 即使Craw

我们有一个现有的基础架构，正在通过AWS爬网程序来爬网S3目录。这些S3目录是作为AWS datalake的一部分创

如果我将Glue用作元存储，是否可以更改其中的任何现有表（例如添加新列或更改列的数据类型）？我能

我可以使用Informatica EDC代替AWS中的Glue目录。 AWS Athena是否与Glue目录紧密结合？

我正在EC2实例上使用增量为0.7.0的独立spark（pyspark）3.0。有人可以指导我如何从Hive Metastore目录（在derby

目标是使用Glue将数据（csv文件）从一个S3存储桶转换为另一个S3存储桶。我已经尝试过的：

我是雪花新手。我想知道如何为雪花数据建立数据目录？我找不到有关的文档。我可以找到这个<a

我正在尝试在AWS Glue中创建ETL作业。用例如下：当运行ETL作业后在源表之一中添加一列，并且当我们尝试

我正在尝试使用胶将Postgres DB（某些表）同步到Redshift。即使有驼峰式列，但大多数表都可以复制，但是

是否可以跟踪我们在AWS Glue中创建的每个作业的工作方式？例如，如果执行相同操作的作业被创建两次，

我需要使用AWS / Athena下载AWS / Glue / Catalog上的完整表格内容。目前，我正在从仪表板运行<code>select * from m

我正在尝试创建从AWS Glue到MongoDB的连接，但是当我测试该连接失败时，将显示以下错误：“检查连接定

我正在尝试使用下面的Scala代码在脚本编辑中以CVS格式过滤到S3后写入数据帧。当前状态： <ul> <

我有这样的S3文件夹结构桶/市场/日期/业务/小时/*.parquet 其中只有存储桶名称是固定的，其余的都是可

我正在尝试使用Hive在EMR中运行的spark中的s3路径位置在Glue目录中创建一个表。我尝试了以下命令，但收

我刚接触AWS Glue，想了解如何执行以下操作： <ol> <li>从AWS Glue中的URL提取CSV文件</li> <li>将数据集与我

分类导航