微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

查找字符串的编码方式

如何解决查找字符串的编码方式

我正在处理一个 xml 文件,其中的数字使用不同的方法进行编码。 标题说 "xml version="1.0" encoding="utf-8"" ,但我发现不仅使用了 utf8。 以下字符串我相信使用了相同的编码方法。但我无法弄清楚使用的方法。请参见下面的字符串是相应的小数和括号中的单位。字符串可能包含也可能不包含单位。

40413CA4FCA42AED  5.000 (ksi)
40A2C00000000000  0.15 (kcf)  
40A2200000000000  0.145 (kcf)
40DB627A7915AB7E  4067.135889 (ksi)
3FC999999999999A  0.2 (no unit)
400D99D5D4C224D1  0.5366563 (ksi)

下面是我用来解释这些字符串的python代码。在 6 个字符串中,我得到了一个正确的 0.2

import struct
# define double_to_hex (or float_to_hex)
def double_to_hex(f):
    return hex(struct.unpack('<Q',struct.pack('<d',f))[0])
print(double_to_hex(0.5366563))

有什么建议吗?

解决方法

我猜是单位不匹配。

import struct
import pandas as pd
import io   

mydata = '''hxstr decval unit
40413CA4FCA42AED 5.000 (ksi)
40A2C00000000000 0.15 (kcf)
40A2200000000000 0.145 (kcf)
40DB627A7915AB7E 4067.135889 (ksi)
3FC999999999999A 0.2 (nou)
400D99D5D4C224D1 0.5366563 (ksi)
'''

df = pd.read_csv( io.StringIO(mydata),sep=" ")
for index,row in df.iterrows():
    print( 
      row.hxstr,row.unit,struct.unpack(
        '>d',bytes.fromhex(row.hxstr))[0] / float(row.decval)) 

结果显示相同单位的比率大致相同:

40413CA4FCA42AED (ksi) 6.894757
40A2C00000000000 (kcf) 16000.0
40A2200000000000 (kcf) 16000.000000000002
40DB627A7915AB7E (ksi) 6.89475699994749
3FC999999999999A (nou) 1.0
400D99D5D4C224D1 (ksi) 6.894757187574625

这里

  • 6.894757 ksi 的比率类似于以下转换(前提是 ksi 表示 每平方英寸千磅 em>): 1 ksi = 6.8947572932 MPa (Megapascal),
  • 1.0 无单位的比例似乎是正确的,但是
  • 16000.0 kcf 的比率我无法识别......

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。