如何解决R编程中如果标签名称以“G”开头,如何去掉列标签
代码:
library(pdftools)
library(data.table)
library(tabulizer)
pdf_file <- "new.pdf"
out2 <- extract_tables(pdf_file,pages =c(89),output = "data.frame")
out2<-as.data.table(out2)
colnames(out2)
实际输出:
"Group.1" "Day.7" "Day.8" "Day.9"
"Group.2" "Day.10" "Day.11","Day.12"
预期输出:
"Day.7" "Day.8" "Day.9"
"Day.10" "Day.11","Day.12"
另外请向我建议任何其他从 PDF 中提取数据表的 R 包(pdftools 和 tabulizer 除外)
解决方法
这将删除以 "G"
开头的列:
result <- out2[,!startsWith(names(out2),"G")]
,
您可以使用dplyr::select
:
library(dplyr)
dplyr::select(out2,-starts_with("G"))
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。