如何解决Informatica - 通过使用通过命令任务调用的程序来确定和是否需要转换文件编码是否可行?
我们公司处理来自不同市场和多种语言的发票数据。通常,数据以 .txt 或 .dat 文件形式提供。这些文件中发票数据的格式或布局在许多市场中可能是通用的。例如。来自巴西的文件中发票编号的位置将与来自俄罗斯的文件或来自英国的文件相同。源文件的编码可能会有所不同。来自英国的文件可能被编码为 ASCII,来自巴西的文件 ANSI 和来自俄罗斯的文件 UTF-8。这不是一成不变的。我们的目标数据库配置为 UTF-8。
由于每个文件之间的数据布局基本相同,如果可能,我们希望通过一个 Informatica 工作流程处理所有文件,并在运行时根据需要转换文件编码。
我不是 Java 开发人员,但我想到是否可以从命令任务调用 jar 来检查文件编码并在需要时运行转换。
或者我应该寻找其他类型的解决方案?
解决方法
这个想法是'将所有非 UTF 文件转换为 UTF-8,这是最高设置并且可以处理几乎所有字符集。因此,请按照以下步骤操作 -
- 使用
file --mime-encoding inp_file
检查编码 - 使用 powershesll(链接 - superuser.com/questions/1163753/...)或 UNIX/LINUX shell(链接 - stackoverflow.com/questions/64860/...)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。