微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何为dplyr sample_n函数分配随机种子?

如何解决如何为dplyr sample_n函数分配随机种子?

这是R中dplyr的“ sample_n”。
https://dplyr.tidyverse.org/reference/sample.html

为了可重复性,我应该放置一个种子,以便其他人可以获得我的准确结果。

是否有内置方法为“ sample_n”设置种子? 这是我在环境中执行的操作,并且“ sample_n”对此做出响应吗?

这些不是内置在“ sample_n”函数中。

解决方法

dplyr::sample_n documentation告诉您:

这是sample.int()的包装,使从表中选择随机行变得容易。当前仅适用于本地tbl。

sample_n之后,调用sample.int,这意味着使用了标准的随机数生成器,并且可以使用set.seed来实现可重复性。

,

此示例有帮助吗?在其中,我使用的是set.seedmtcars数据集。

set.seed(1)
x <- mtcars
sample_n(x,10)

sample_n(x,10) #without set.seed()

set.seed(1)
x <- mtcars
sample_n(x,10)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。