我正在尝试在数据帧中选择列,其中列中包含的字符串与正则表达式或子字符串匹配:
数据帧:
aName bName pName call alleles logRatio strength AX-11086564 F08_ADN103 2011-02-10_R10 AB CG 0.363371 10.184215 AX-11086564 A01_CD1919 2011-02-24_R11 BB GG -1.352707 9.54909 AX-11086564 B05_CD2920 2011-01-27_R6 AB CG -0.183802 9.766334 AX-11086564 D04_CD5950 2011-02-09_R9 AB CG 0.162586 10.165051 AX-11086564 D07_CD6025 2011-02-10_R10 AB CG -0.397097 9.940238 AX-11086564 B05_CD3630 2011-02-02_R7 AA CC 2.349906 9.153076 AX-11086564 D04_ADN103 2011-02-10_R2 BB GG -1.898088 9.872966 AX-11086564 A01_CD2588 2011-01-27_R5 BB GG -1.208094 9.239801
例如,我想要一个仅包含列bName列中的ADN的数据帧。其次,我想在列bName中包含ADN的所有行,并且在列pName中匹配2011-02-10_R2。
我尝试使用函数grep(),agrep()等等,但没有成功…
subset(dat,grepl("ADN",bName) & pName == "2011-02-10_R2" )
注“&” (而不是向量化的“&&”)和“==”(而不是“=”这是赋值)。
请注意,您可以使用:
dat[ with(dat,bName) & pName == "2011-02-10_R2" ),]
…并且在内部函数中使用时可能会更为可取,但是将返回dat $ pName为NA的任何行的NA值。该缺陷(某些视为特征)可以通过添加& !is.na(dat $ pName)到逻辑表达式。
原文地址:https://www.jb51.cc/regex/357455.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。