在熊猫数据框列内的嵌套列表中转换和求和元素

如何解决在熊猫数据框列内的嵌套列表中转换和求和元素

我有一个类似df的列:

col1
[[0.73,0.43,0.5,0.0],[0.39,0.5],[0.37],[0.38,0.51,0.0,0.2]]
[[0.53,0.33,0.2,[0.79,[0.96],[0.88,0.21,0.0]]

子列表可以是任意大小。 我正在尝试将子列表中的数字转换为浮点数(它们是字符串),然后创建一列以对每个子列表求和,然后除以子列表中的项目数

所以第1行的和:

(.73 + .43 + .5 + 0) / 4 =.415
(.39 + .5) / 2 = .445
(.37) / 1 = .37
(.38 + .51 + 0.0 + .2) / 4 = .272

第2行:

(.53 + .33 + .2 + 0) / 4 = .265
(.79 + .5) / 2 = .645
(.96) / 1 = .96
(.88 + .21 + 0.0 + 0.0) / 4 = .272

结果

new_col
[[.415],[.445],[.37],[.272]]
[[.265],[.645],[.96],[.272]]

我尝试了很多东西:

#something like this where it creates a column of the number of elements in each sublist and then uses that to divide the sum of each number

# this didn't work - just grabbed the first lists size
df1['words_in_company_name'] = df1['children_org_name_sublists'].str.len()

#this doesn't really work - i mean it shows the numbers per list,just not sure where to go from here
for i in df1.func_scores:
    length = []
    for j in i:
        print(j)

A

解决方法

只需对applynp.mean

df['new_col'] = df.col.apply(lambda x : [[np.mean(y)] for y in x ])
df
Out[17]: 
                                                 col                               new_col
0  [[0.73,0.43,0.5,0.0],[0.39,0.5],[0.37],...  [[0.415],[0.445],[0.2725]]
1  [[0.53,0.33,0.2,[0.79,[0.96],...  [[0.265],[0.645],[0.2725]]

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?