微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

【R语言数据处理】一步一步来分析数据之不知哪位收集的淘宝推荐的数据之一,数据处理

文件名:淘宝最全年货大促特价整理

数据我先传百度云了,分享一下,你们看了就知道是什么样子的了,我改了一下名字,文件名:tbtj.xls

360云盘:https://yunpan.cn/cMTiN2Lyk5MpK 访问密码 d2cc

百度云:http://pan.baidu.com/s/1hsBHuGO

我们先来看下里面是什么样子的

tbtj.xls内容截图


首先,你需要安装一个

install.packages("readxl")#用来读取xls文件
library(readxl)#好像可能不需要library就可以直接用来,还是加载一下
#读取xls中的数据,本人的命名依据下面表的名称的拼音简写来的
hcd<-read_excel("tbtj.xls",sheet=1)#好吃的拼音首写,下面类似
abm<-read_excel("tbtj.xls",sheet=2)
nvrz<-read_excel("tbtj.xls",sheet=3)
nanrz<-read_excel("tbtj.xls",sheet=4)
abb<-read_excel("tbtj.xls",sheet=5)
bld<-read_excel("tbtj.xls",sheet=6)
wcd<-read_excel("tbtj.xls",sheet=7)
ald<-read_excel("tbtj.xls",sheet=8)
bxj<-read_excel("tbtj.xls",sheet=9)

#由于他们是分开的,把他们弄到一起
tbtj<-rbind(hcd,abm,nvrz,nanrz,abb,bld,wcd,ald,bxj)#淘宝推荐首写

来看下tbtj这个数据框是什么样的

淘宝推荐数据框

显然,我们需要删掉一些列【市场价:折扣力度:商品链接:备货数】

newtbtj<-tbtj[,-c(3,5,7,8)]

新的淘宝推荐数据框


先保存一下数据

save(newtbtj,file="newtbtj.RData")
#读取的话使用 load("newtbtj.RData")

由于数据里面没有空值。理论上现在就可以开始分析了
还是判断一下

table(is.na(newtbtj))
table(is.null(newtbtj))

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐