根据另一列pandas python

如何解决根据另一列pandas python

我正在尝试对这个数据集做一些简单的操作。

enter image description here

我正在尝试:

  1. 计算归因于每个集群的总计数。例如,对于集群 0,我必须求和 7+4+61+7+12= 91
  2. 添加一个新列“总计数”,其中总计数与相应的集群配对出现(即,“集群”列中值为“0”的行,“集群”中的值为 91总计数列
  3. 将“计数”列除以“计数总数”并乘以 100(计算计数的百分比)。结果应添加到新列中。

有人可以帮我写一个代码吗?

解决方法

  1. 要计算归因于每个集群的总数,请使用以下代码:

    total = df.groupby('clusters')['count'].sum().rename('total of counts')

  2. 要添加一个新列“总计数”,其中总计数与相应的集群成对出现,请使用以下代码:

    df = df.join(total,on='clusters',lsuffix='')

  3. 要将列“计数”除以“总计数”并乘以 100,请使用以下代码:

    df['counts by total of counts'] = df['count']/df['total of counts']*100

,

假设您已调用数据框 df,您可以执行以下操作:

第 1 点 在集群列上使用 groupby() 方法并使用 sum() 聚合方法计算总和,例如:

df_grouped = df.groupby('clusters').sum()

完成后,您可能希望将该数据框中的列重命名为更有用的名称,例如:

df_grouped = df_grouped.rename(columns={'count': 'cluster_count'})

第 2 点 要将总和返回到您的数据框中,您可以将 grouped_df 与原始数据框合并,例如:

df_merged = pd.merge(left=df,right=df_grouped,left_on='clusters',right_index=True)

您使用“集群”列的位置是您左侧数据帧的键,并使用 df_grouped 数据帧的索引(集群值将在第 1 点的 groupby() 操作之后出现在索引中)。

第 3 点 最后一步现在是微不足道的。只需使用您的最终数据框并添加一个包含所需计算结果的新列:

df_merged['count_pct_cluster'] = df_merged['count'] / df_merged['cluster_count'] * 100
,

你可以使用 这行代码将为您提供名为 total 的新列和 此列将是从第 0 列到第 11 列的值的平均值 在这里您可以用您需要的任何其他操作替换平均值

 df['total'] = df.iloc[:,:12].mean()

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?