微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

实验一 Pandas操作实验

一、实验要求

按要求完成题目,在实验报告中应有代码和运行截图以及心得体会

二、实验题目

  1. 读取群文件“数据分析实验一”中的”us-state.csv”,加载为dataframe,要求读取state列作为行索引
  2. 选择出所有面积大于100000的州的数据
  3. 获取Arkansas,Texas,California三个州的数据
  4. 获取[5,10]行数据
  5. 将DataFrame中数据按照行索引升序排序
  6. 将DataFrame中数据按照州面积降序排序
  7. 计算最大面积州与最小面积州的差值
  8. 计算平均面积
  9. 删除DataFrame中的州简写(abbreviation)那一列
  10. 将Florida州的面积修改为你的学号
  11. 修改后的DataFrame写入excel文件中,文件名为“你的名字.xlsx”,如“张三.xlsx”,excel文件中保留行索引,不保留列索引

三、实验代码与运行结果:

1   import pandas as pd

df=open(r'D:\数据分析\us-state.csv')

df=pd.read_csv(df,index_col='state',names=None)

df   #读取群文件“数据分析实验一”中的”us-state.csv”,加载为dataframe,要求读取state列作为行索引

 

 2   df[df['area'] > 100000]#选择出所有面积大于100000的州的数据

 

 3  df.loc[['Alaska','Texas','California'],:]   #获取Arkansas,Texas,California三个州的数据

 

 4   df.iloc[5:10,:]    #获取[5,10]行数据

 

 5  df.sort_index()   #将DataFrame中数据按照行索引升序排序

 

 6  df.sort_values('area',ascending=False)#将DataFrame中数据按照州面积降序排序

 

 7  df_obj=(df['area'].max()-df['area'].min())

   df_obj   #计算最大面积州与最小面积州的差值

 

 8  df['area'].mean()   #计算平均面积

 

9  df.drop('abbreviation',axis=1,inplace=True)

 

   df   #删除DataFrame中的州简写(abbreviation)那一列

 

 

10  df.iloc[8]='xxxxxxxx'

        df   #将Florida州的面积修改为你的学号

 

 

 (截图请自己实现)

11  df.to_excel(r'D:\数据分析\你的名字.xlsx',index=True,columns=None)

#将修改后的DataFrame写入excel文件中,文件名为“你的名字.xlsx”,如“张三.xlsx”,excel文件中保留行索引,不保留列索引

 (截图请自己实现)

 

 

完整报告请私信

 

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐