如何解决当数据已经被双引号引起来时,如何在数据中转义双引号
我有用逗号分隔的CSV数据,如下所示,必须使用复制命令将其导入雪花表。
"1","2","3","2"In stick"
由于我已经传递了参数OPTIONALLY_ENCLOSED_BY ='“'来复制命令,所以我无法对数据中的”(双引号)(“ 2” In stick“)进行转义。
我要在表格中看到的导入数据如下所示
1,2,3,2"In stick
有人可以在这里帮忙吗?谢谢!
解决方法
如果您使用Windows,那么我有一个有趣的解决方案。在MS Excel中打开此CSV文件。 Excel使用正确的双引号以蜂窝格式显示数据,而多余的双引号留在单元格的中间(如果每个单元格之间都用逗号正确分隔)。然后选择“替换”,并用其他东西替换双引号(例如两个单引号或不替换以删除它们)。然后再次将其另存为CSV。我认为其他电子表格程序也应该这样做。
,如果您在一个字段中有一个未转义的报价,且该报价被实际上不是有效CSV的报价所包围。例如,这是RFC4180 spec
的摘录
- 如果使用双引号将字段括起来,则使用双引号 出现在字段中的字符必须通过在其前面加上另一个双引号进行转义。
例如:
# SELECT * FROM history WHERE my_column @> '{"states": [{ "id": "order.new" }]}';
id | my_column
----+-------------------------------------------------------------------------------------------------------------------------------------------------
1 | {"id": 4107,"states": [{"dt": "2020-11-06T10:24:30.277+0000","id": "order.new"}]}
4 | {"id": 4107,"states": [{"dt": "2020-11-06T10:24:30.333+0000","id": "order.test"},{"dt": "2020-11-06T10:24:33.333+0000","id": "order.new"}]}
我认为生成CSV文件的方式均做得不正确,需要先进行修复,然后才能将其加载到Snowflake中。我认为任何"aaa","b""bb","ccc"
选项都无法为您解决此问题,因为它不是有效的CSV。
CSV行应如下所示:
file_format
或者这个:
"1","2","3","2""In stick"
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。