微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

VB.net 读取 Cobol 文件字段纯二进制、EBCDIC、打包

如何解决VB.net 读取 Cobol 文件字段纯二进制、EBCDIC、打包

我需要将 Cobol 文件读入 VB.net。以下是文档中对数据类型的描述:

All Magnetic tape files are recorded in 9-track,8OOBPI mode with odd parity. They are created IBM equipment disk operating system.  IBM System 360 Standard. 

Binary - Data is coded in pure binary code.

BCD - Data is coded in binary coded decimal format. (Primarily
for files created by the IBM 1401 System).

EBCDIC - Data is coded in extended binary coded decimal interchange code. :(An IBM developed code.)

Packed - Data is coded in packed decimal format. 

File Format:
1-2 Record Count [Numeric] (Binary)
3-4 Filler (Binary)
5-5 Record Type [B or R] (EBCDIC)
6-10 Sales Location Numeric [9 digit number] (Packed)
11-13 Sales Identifier (3 character Alpha) (EBCDIC]
etc

所以,我知道我应该将整个文件读入一个字节数组,这就是我知道要做的事情的极限...... A) 我看到另一篇关于 EBCDIC 对话的帖子使用

System.Text.Encoding.GetEncoding(37) 

但它是针对整个文件的。如果我通过它运行整个文件,我会看到可理解的文本,但当然其他字段是垃圾。我不知道正确解码单个字段的语言。 B) 我不知道如何处理 PURE 二进制格式。 C) 我不知道如何阅读 Packed,尤其是作为单个字段

我为 PURE BINARY 尝试了多种解码选项,但我为第一个字段获得的数字与文档中规定的行长度不一致。

解决方法

压缩十进制格式:

对于 s9(5)V9(4) comp-3,123.45 以字节格式表示为

      00 12 34 50 0c

每个数字用 4 位表示,末尾有一个 4 位符号 (c),3 后面是假定的十进制数。

大多数语言都提供了将字节/字节转换为字符串的例程,即字节 x'34' -->> 字符串 '34'。所以你可以:

  1. 将字节转换为字符串表示
  2. 添加小数点
  3. 去掉末尾的符号字符并在前面添加适当的符号

还有其他方法:


其他领域

  • 第一个字段(二进制)可能是一个大端二进制整数或另一个压缩十进制。 .net 中可能内置了一个实用程序来执行此操作。
  • 一次一个字段将字符字段从 ebcdic 转换为 ascii

在 VBA 中,您不需要读取整个文件,您可以逐条读取它。我想你可以在 vb.net 中做同样的事情


有用的工具

这些工具可能对测试有用。

  • RecordEditor 应该能够显示文件。 布局向导应该能够确定文件的格式。或者使用下面的 Cobol 字帖

  • Java 程序 CobolToCsv 应该能够将文件转换为 Csv

          01  tape-record.
              05 record-count          pic s9(3) comp.
              05 filler                pic x(2).
              05 record-type           pic x.
              05 Sales-Location        pic s9(9) comp-3.
              05 Sales-Identifier      pic x(3).
    

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。