微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python:pandas处理DataFrame

DataFrame

1.读入数据
df = pd.read_excel('info.xlsx')
type(df)
# 输出
<class 'pandas.core.frame.DataFrame'>
2.获取前5行
df.head(5)
# 输出
	姓名	年龄	性别	籍贯
0	张三	31	男	上海
1	李四	24	男	北京
2	赵五	47	女	深圳
3	刘六	21	男	广州
4	谭七	19	女	香港
3.获取第3-4行
df[2:4]
# 输出
	姓名	年龄	性别	籍贯
2	赵五	47	女	深圳
3	刘六	21	男	广州
4.获取特定的列
df[['姓名', '籍贯']].head(2)
# 输出
	姓名	籍贯
0	张三	上海
1	李四	北京
5.使用整数下标选择行和列
df.iloc[0:3, 0:3]
# 输出
	姓名	年龄	性别
0	张三	31	男
1	李四	24	男
2	赵五	47	女

注:通过iloc属性实现

6.使用整数和标签的混合来选择行和列
df.loc[df.index[0:3], ['姓名', '性别']]
# 输出
	姓名	性别
0	张三	男
1	李四	男
2	赵五	女

注:通过loc属性实现

7.重置索引为姓名
df = df.set_index('姓名')
# 输出
	年龄	性别	籍贯
姓名			
张三	31	男	上海
李四	24	男	北京
赵五	47	女	深圳
刘六	21	男	广州
谭七	19	女	香港
8.更改列名
df.columns = 'a','b','c'
输出:
	a	b	c
姓名			
张三	31	男	上海
李四	24	男	北京
赵五	47	女	深圳
刘六	21	男	广州
谭七	19	女	香港
9.对数据进行计算
df['a'] = df['a']+2020
# 输出
	a	b	c
姓名			
张三	2052	男	上海
李四	2045	男	北京
赵五	2068	女	深圳
刘六	2042	男	广州
谭七	2040	女	香港

参考:https://mp.weixin.qq.com/s/b-rHS18WQoPJ78NbKaSaXQ

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐