微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

处理CSV文件中包含逗号的数据

如何解决处理CSV文件中包含逗号的数据

我有一个 CSV 文件,正在尝试从 Mosaic Decisions 中的 Amazon S3 中读取。该文件包含一个地址列,其中数据本身包含一个逗号

文件中的示例数据如下所示:

Address
sl,name,address
1,Ratan Kumar,FlatNo 122,Mumbai,Maharashtra

在这种情况下,地址字段将分为3列as-address,Missing_header_0,Missing_header_1,数据将读取为

sl,address,Missing_header_0,Missing_header_1
1,Maharashtra

这会破坏实际数据并覆盖下一个列数据 我们如何避免这种情况?

解决方法

为避免这种情况,

  1. 打开阅读器节点配置
  2. 在“配置”标签的“报价”文本框中输入单引号(')或双引号(“)

Mosaic Decisions的此功能允许将每个字段中的数据都用引号引起来。

这将提供理想的结果。

Refer to the screenshot

,

包含分隔符的字段应用双引号引起来

sl,name,address
1,Ratan Kumar,"FlatNo 122,Mumbai,Maharashtra"

如果您无法控制此文件的创建,则可以与创建者联系并要求修复格式错误的csv文件,或者编写一些自定义代码/脚本来解析前两个字段,并将行的其余部分视为第三个字段(如果地址字段确实是最后一个字段)。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。