如何解决处理CSV文件中包含逗号的数据
我有一个 CSV 文件,正在尝试从 Mosaic Decisions 中的 Amazon S3 中读取。该文件包含一个地址列,其中数据本身包含一个逗号。
文件中的示例数据如下所示:
Address
sl,name,address
1,Ratan Kumar,FlatNo 122,Mumbai,Maharashtra
在这种情况下,地址字段将分为3列as-address,Missing_header_0,Missing_header_1,数据将读取为
sl,address,Missing_header_0,Missing_header_1
1,Maharashtra
这会破坏实际数据并覆盖下一个列数据 我们如何避免这种情况?
解决方法
为避免这种情况,
- 打开阅读器节点配置
- 在“配置”标签的“报价”文本框中输入单引号(')或双引号(“)
Mosaic Decisions的此功能允许将每个字段中的数据都用引号引起来。
这将提供理想的结果。
,包含分隔符的字段应用双引号引起来
sl,name,address
1,Ratan Kumar,"FlatNo 122,Mumbai,Maharashtra"
如果您无法控制此文件的创建,则可以与创建者联系并要求修复格式错误的csv文件,或者编写一些自定义代码/脚本来解析前两个字段,并将行的其余部分视为第三个字段(如果地址字段确实是最后一个字段)。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。