如何解决如何在protobuf中调试无效的utf-8?
我正在使用一些 tensorflow 代码并尝试加载一个经过训练的检查点,但它失败了,出现了这样的 protobuf 错误:
[libprotobuf ERROR google/protobuf/wire_format_lite.cc:577] String field 'tensorflow.TensorShapeProto.Dim.name' contains invalid UTF-8 data when parsing a protocol buffer. Use the 'bytes' type if you intend to send raw bytes.
Traceback (most recent call last):
[...]
File "/home/sopi/miniconda3/envs/magenta2/lib/python3.7/site-packages/tensorflow/python/framework/ops.py",line 3053,in _as_graph_def
graph.ParseFromString(compat.as_bytes(data))
google.protobuf.message.DecodeError: Error parsing message
为了调试显然产生无效 utf-8 的训练代码,我想知道有问题的无效数据实际上是什么样的。由于 ParseFromString()
是在 C++ 中实现的,因此单步执行 pdb 中的代码并没有让我走得很远。
如何找出无效的 utf-8 数据?甚至是字节数组中发生错误的位置?
(在这种情况下,graph
是一个 tensorflow.core.framework.graph_pb2.GraphDef
,它是 google.protobuf.message.Message
的子类。但我的问题一般涉及 protobuf 解析,我认为没有什么特别之处GraphDef
在这方面)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。