如何解决蟒蛇,熊猫DF从字符串中取出数字并将其添加到新列
我得到了一个 Pandas 数据框,其中一列的值如下所示:
>>> df['video_p25_watched_actions']
[{'action_type': 'video_view','value': '137520'}]
Index | video_p25_watched_actions | p25
-----------------------------------------------------------------
0 | [{'action_type': 'video_view','value': '137520'}] | 137520
我用一些原始数据创建了一个谷歌表来展示它的样子:
https://docs.google.com/spreadsheets/d/1aJDiXFyUIb9gZCA1-pPDxciPQWv0vcCairY-pkdGg_A/edit?usp=sharing
先谢谢你!
解决方法
由于列中的所有行具有相同的结构,因此您可以使用此
df['new_column'] = df['video_p25_watched_actions'].apply(lambda x: ''.join(e for e in x.split(":")[2] if e.isalnum()))
,
试试:
df['value']= df['video_p25_watched_actions'].replace(regex=True,to_replace='[^0-9]',value=' ')
仅从 df['video_p25_watched_actions'] 中获取值,其他字母将被空格替换
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。