如何解决从数据框中删除零行将产生零行数据框
| 我有一个脚本,其中包含一堆质量控制校验和,并且由于质量控制而被捕获在无需删除任何样本(行)的数据集上。但是,此脚本给了我零行数据框的意外结果。使用示例数据,为什么这样做有效:data(iris)
##get rid of those pesky factors
iris$Species <- NULL
med <- which(iris[,1] < 4.9)
medtemp <- iris[-med,]
dim(medtemp)
[1] 134 4
但这会返回零行的数据框:
small <- which(iris[,1] < 4.0)
smalltemp <- iris[-small,]
dim(smalltemp)
[1] 0 4
就像这样:
x <- 0
zerotemp <- iris[-x,]
dim(zerotemp)
[1] 0 4
似乎“ 3”数据帧应与“ 4”大小相同,因为根本没有要删除的行。为什么是这样?
解决方法
逐字复制自Patrick Burns的R Inferno p。 41(我希望这构成“合理使用”,如果有人反对,我将其删除)
消极是什么
> x2 <- 1:4
> x2[-which(x2 == 3)]
[1] 1 2 4
上面的命令返回x2
中所有不等于3的值。
> x2[-which(x2 == 5)]
numeric(0)
希望上面的命令返回所有x2
,因为没有元素
等于5。现实会破灭希望。而是返回一个长度向量
零。
以下两个语句之间有细微的差别:
x[]
x[numeric(0)]
输入中的细微差别,但输出中的细微差别。
原始问题至少有三种可能的解决方案。
out <- which(x2 == 5)
if(length(out)) x2[-out] else x2
另一个解决方案是使用逻辑下标:
x2[!(x2 %in% 5)]
或者,从某种意义上讲,您可以倒退:
x2[ setdiff(seq along(x2),which(x2 == 5)) ]
, 可能第二个例子中的small
等于0吗?
取向量的第零个元素将始终返回空向量:
> foo <- 1:3
> foo
[1] 1 2 3
> foo[0]
integer(0)
>
, 与其使用using15来获取索引,不如使用布尔向量并将其取反。这样,您可以执行以下操作:
small <- iris[,1] < 4.0
smalltemp <- iris[!small,]
dim(smalltemp)
[1] 150 4
编辑:我不认为负索引0(如您的情况)是允许的,因为没有第0个索引,因此R不能从您的选择中排除该索引。负索引可以解释为:\“退还除具有这些索引的那些行外的所有行\”。
, 这是因为处理索引为零的规则。仅允许使用严格的正索引或严格的负索引。 [0]
什么也不会返回,
R> -0 == 0
[1] TRUE
因此,您什么也不会得到,而您期望它不会下降。
identical(0)
问题被视为由treated20 index进行索引,并且记录该文档的工作方式就像被0
进行索引一样,因此具有相同的行为。
R语言定义手册中对此进行了讨论。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。