如何解决如果我将数据反序列化为错误的类型,为什么 bincode 没有检测到错误?
当我尝试将二进制数据反序列化为错误类型时,为什么没有从 bincode 中得到错误?
use bincode; // 1.3.1
use serde::{Deserialize,Serialize}; // { version = "1.0",features = ["derive"] }
#[derive(Serialize,Deserialize,copy,Clone,Debug)]
pub struct Ping {
pub pinger_id: usize,pub useless_field: usize,pub i_need_one_more: usize,}
#[derive(Serialize,Debug)]
pub struct Heartbeat {
pub term: usize,pub node_id: usize,Debug)]
pub enum Message {
Heartbeat(Heartbeat),Ping(Ping),}
fn main() {
let rpc_message_bin = bincode::serialize(&Ping {
pinger_id: 0,useless_field: 1,i_need_one_more: 2,})
.unwrap();
let m: Message = bincode::deserialize(&rpc_message_bin).unwrap();
println!("{:#?}",m);
}
我原以为会得到 Message::Ping
但我得到了:
Heartbeat (
Heartbeat {
term: 4294967296,node_id: 8589934592,},)
解决方法
bincode 相信用户会反序列化为预期的类型,您正在执行的操作具有“随机”结果,这是安全的,但它是实现行为。
以下只是一个例子,这可能是错误的,但逻辑是正确的。 rust 中的 enum
是实现行为,bincode 通过假设 enum
总是用无符号整数值表示来“滥用”rust,bincode 也选择将其编码为 u32
值 {{3 }}。从用户的角度来看,这并不重要(除了 enum
与最大 2**32
变体的“限制”......)。
所以,这就是 bincode 的做法。在您的代码中,您要求 bincode 加入一个 Ping
结构,而不是变体 Message::Ping
。
这意味着编码缓冲区将包含 3
usize
之类的 Ping
结构。然后您要求 bincode 将此数据解释为 Message
enum
,基本上这将要求 bincode 从缓冲区读取 u32
,在本例中,这将通过读取 {{1} },而这恰好是用于表示 0
Message
的第一个变体的数字 rust 和 bincode。所以 bincode 会认为“好吧,我正在读取一个 enum
然后 bincode 会再读取 2 个 usize 来填充 Message::Heartbeat
结构。就像在 64 位系统中读取 u32 一样会引入 {{ 1}} 个八位字节,bincode 不会读取 Heartbeat
和 4
,而是 1
和 2
。
这意味着在编码缓冲区中你有类似的东西
1 << 32
从二进制代码的角度来看,这是完全有效的。 bincode 的意思是与 reader 一起使用,因此 reader 光标仍有 2 << 32
个八位字节可供读取。
我们可以玩一下,如果你稍微改变一下编码值[0,1,2,0]
^ first usize $ ^ second usize $ ^ last usize $
^ u32 $ ^ first usize $ ^ second usize $
,你会得到一个错误信息:
4
我们也可以通过将第一个 pinger_id: usize::MAX
从 thread 'main' panicked at 'called `Result::unwrap()` on an `Err` value: Custom("invalid value: integer `4294967295`,expected variant index 0 <= i < 2")',src\main.rs:31:61
改为 usize
来玩:
Ping
现在使用这些值进行编码:
u32
会导致#[derive(Serialize,Deserialize,Copy,Clone,Debug)]
pub struct Ping {
pub pinger_id: u32,pub useless_field: usize,pub i_need_one_more: usize,}
和 let rpc_message_bin = bincode::serialize(&Ping {
pinger_id: 0,useless_field: 1,i_need_one_more: 2,})
:
1
如果 2
结构太小:
Heartbeat(
Heartbeat {
term: 1,node_id: 2,},)
bincode 会报错说缺少数据:
Ping
因此,总而言之,如果将变体反序列化为枚举类型,则不得发送变体的“直接”值。使用 bincode 或任何序列化工具时,您必须始终将编码的类型与解码的类型相匹配,因此您必须直接序列化 #[derive(Serialize,Debug)]
pub struct Ping {
pub pinger_id: usize,}
而不是 thread 'main' panicked at 'called `Result::unwrap()` on an `Err` value: Io(Kind(UnexpectedEof))',src\main.rs:27:61
。 >
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。