如何解决如何分割十进制数字后跟字母?
我有如下日期
A <- c("-0.00023--0.00243unitincrease","-0.00176-0.02176pmol/Lincrease(replication)","0.00180-0.01780%varianceunitdecrease")
我想将数字部分和其余部分提取为两列 B 和 C。 提取后应该得到如下数据框:
# A B C
# -0.00023--0.00243unitincrease -0.00023--0.00243 unitincrease
# -0.00176-0.02176pmol/Lincrease(replication) -0.00176-0.02176 pmol/Lincrease(replication)
# 0.00180-0.01780%varianceunitdecrease 0.00180-0.01780 %varianceunitdecrease
如何在 R 中获得该结果?
解决方法
您可以使用 strcapture
并传递正则表达式来提取数据。
这里我们将 A
分为两列 B
和 C
,其中 B
列由一个可选的负号和一个十进制数组成,后跟一个 {{1} } 和另一个十进制数,而列 -
包含其他所有内容。
在基础 R 中,您可以使用 C
:
strcapture
您可以在 result <- cbind(A,strcapture('(-?\\d+\\.\\d+.*-\\d+\\.\\d+)(.*)',A,proto = list(B = character(),C = character())))
result
# A B C
#1 -0.00023--0.00243unitincrease -0.00023--0.00243 unitincrease
#2 -0.00176-0.02176pmol/Lincrease(replication) -0.00176-0.02176 pmol/Lincrease(replication)
#3 0.00180-0.01780%varianceunitdecrease 0.00180-0.01780 %varianceunitdecrease
中使用相同的正则表达式,这将产生相同的输出。
tidyr::extract
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。