技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

高级处理-分组与聚合

时间：2021-07-13分类：MySQL作者：Tracydzf原文地址

分组与聚合通常是分析数据的一种方式，通常与一些统计 函数一起使用，查看数据的分组情况

想一想其实刚才的交叉表与透视表也有分组的功能，所以算是分组的一种形式，只不过他们主要是计算次数或者计算比例！！看其中的效果

1 什么分组与聚合

2 分组API

DataFrame.groupby(key,as_index=False)
- key:分组的列数据，可以多个
案例:不同颜色的不同笔的价格数据

col =pd.DataFrame({'color': ['white','red','green','green'],object'pen','pencil','ashtray','pen'price1':5.56,4.20,1.30,0.56,2.75price24.75,4.12,1.60,0.75,3.15]})

color    object    price1    price2
0    white    pen    5.56    4.75
1    red    pencil    4.20    4.12
2    green    pencil    1.30    1.60
3    red    ashtray    0.56    0.75
4    green    pen    2.75    3.15

进行分组，对颜色分组，price进行聚合

# 分组，求平均值
col.groupby('color'])'price1'.mean()
col].groupby(col).mean()

color
green    2.025
red      2.380
white    5.560
Name: price1,dtype: float64

# 分组，数据的结构不变
col.groupby(=False).mean()

color    price1
0    green    2.025
1    red    2.380
2    white    5.560

3 星巴克零售店铺数据

现在我们有一组关于全球星巴克店铺的统计数据，如果我想知道美国的星巴克数量和中国的哪个多，或者我想知道中国每个省份星巴克的数量的情况，那么应该怎么办？

3.1 数据获取

从文件中读取星巴克店铺数据

# 导入星巴克店的数据
starbucks = pd.read_csv("./data/starbucks/directory.csv")

3.2 进行分组聚合

 按照国家分组，求出每个国家的星巴克零售店数量
count = starbucks.groupby(['Country']).count()

画图显示结果

count[Brand'].plot(kind=bar',figsize=(20,8))
plt.show()

假设我们加入省市一起进行分组

 设置多个索引，set_index()
starbucks.groupby([State/Province']).count()

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：如何提高sql执行效率?下一篇：你有多久没涨过工资了？

相关推荐

优化MySQL数据库发布系统存储的方法是什么

优化MySQL数据库发布系统存储的方法有：1.mysql库主从读写分离。2.适当的添加索引。3.选取最适用的字段属性。4.不经常改动的页面，生成静态页面。5.添加缓存机制。6.找规律分表，减少单表中的...

作者：编程之家时间：2024-10-04

怎么使用mysql

使用mysql的方法：在“我的电脑”→右键→“管理”→“服务”→启动和关闭MySQL服务，或者Win+R快捷键输入“cmd”打开窗口，再输入“net  start  MySQL服务...

作者：编程之家时间：2024-10-04

mysql怎么查看root权限

在mysql中查看root用户权限的方法：1.命令行启动mysql服务；2.登录mysql；3.选择数据库；4.执行“show grants for root;”命令查看权限；在mysql中查看roo...

作者：编程之家时间：2024-10-04

什么是Mysql主从复制

MySQL主从复制是用来备份一个与主数据库一样环境的从数据库，是MySQL最重要的功能之一，对于多级复制，数据库服务器即可充当主机，也可充当从机，而主从复制的基础是主服务器对数据库修改记录二进制日志，...

作者：编程之家时间：2024-10-04

怎么运行mysql

运行mysql的方法1.启动mysql服务，在“我的电脑”→右键→“管理”→“服务”→ 找到MySQL服务启动。2.然后下载Navicat Preminum、SQLyogEnt等管理工具。3.下载安装...

作者：编程之家时间：2024-10-04

如何开启mysql

开启mysql的方法1.可以通过快捷键win+r，输入cmd，打开窗口，接着输入命令“net start mysql”启动服务即可。2.可以通过“服务或者任务管理器查看mysql的启动状态”，步骤：右...

作者：编程之家时间：2024-10-04

如何管理mysql数据库

管理mysql数据库的方法可以打开mysql脚本，输入密码登录，通过以下命令进行管理：1.查看一下数据库列表：“# show databases;”2.进入某个数据库：“ # use dat...

作者：编程之家时间：2024-10-04

psc怎么导入mysql

psc导入mysql的方法：1.安装Navicat软件，连接数据库。2.找到Navicat的备份目录。3.把psc备份文件复制进来。4.在恢复备份时，先在Navicat软件中建立相应的数据库名。5.建...

作者：编程之家时间：2024-10-04

mysql锁表怎么解决

mysql锁表的解决方法：在mysql执行以下sql语句解决。//查看进程id，然后用kill id杀掉进程show processlist;SELECT *&nbs...

作者：编程之家时间：2024-10-04

mysql中avg函数怎么用

在mysql中使用avg函数的方法：avg函数是用于计算一组值或表达式的平均值，语法：SELECT AVG(column_name) FROM 'table_name'；avg函数作用...

作者：编程之家时间：2024-10-04

小编推荐

苹果市值2025年有望达4万亿美元