当数据已经被双引号引起来时，如何在数据中转义双引号

如何解决当数据已经被双引号引起来时，如何在数据中转义双引号

我有用逗号分隔的CSV数据，如下所示，必须使用复制命令将其导入雪花表。

"1","2","3","2"In stick"

由于我已经传递了参数OPTIONALLY_ENCLOSED_BY ='“'来复制命令，所以我无法对数据中的”（双引号）（“ 2” In stick“）进行转义。

我要在表格中看到的导入数据如下所示

1,2,3,2"In stick

有人可以在这里帮忙吗？谢谢！

解决方法

如果您使用Windows，那么我有一个有趣的解决方案。在MS Excel中打开此CSV文件。 Excel使用正确的双引号以蜂窝格式显示数据，而多余的双引号留在单元格的中间（如果每个单元格之间都用逗号正确分隔）。然后选择“替换”，并用其他东西替换双引号（例如两个单引号或不替换以删除它们）。然后再次将其另存为CSV。我认为其他电子表格程序也应该这样做。

如果您在一个字段中有一个未转义的报价，且该报价被实际上不是有效CSV的报价所包围。例如，这是RFC4180 spec

的摘录

如果使用双引号将字段括起来，则使用双引号出现在字段中的字符必须通过在其前面加上另一个双引号进行转义。

例如：

# SELECT * FROM history WHERE my_column @> '{"states": [{ "id": "order.new" }]}';
 id |                                                                    my_column                                                                    
----+-------------------------------------------------------------------------------------------------------------------------------------------------
  1 | {"id": 4107,"states": [{"dt": "2020-11-06T10:24:30.277+0000","id": "order.new"}]}
  4 | {"id": 4107,"states": [{"dt": "2020-11-06T10:24:30.333+0000","id": "order.test"},{"dt": "2020-11-06T10:24:33.333+0000","id": "order.new"}]}

我认为生成CSV文件的方式均做得不正确，需要先进行修复，然后才能将其加载到Snowflake中。我认为任何"aaa","b""bb","ccc"选项都无法为您解决此问题，因为它不是有效的CSV。

CSV行应如下所示：

file_format

或者这个：

"1","2","3","2""In stick"

当数据已经被双引号引起来时，如何在数据中转义双引号

如何解决当数据已经被双引号引起来时，如何在数据中转义双引号

解决方法

相关推荐