微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

遍历 Panda 的 df col 以删除 str

如何解决遍历 Panda 的 df col 以删除 str

我正在努力解决这个问题。基本上,我的专栏 'review' 有一堆由汤返回的垃圾 HT​​ML 内容。我不确定如何删除它并尝试以各种方式进行迭代。 您将如何遍历 df 并替换这些值?我希望它们是空白的,但我正在使用 HELLO 进行测试。

for index,row in enumerate(df['review']):
    row = df.replace('<div class="text show-more__control">','HELLO',inplace=False)
    df['review'] = row

解决方法

您可以使用常规字符串函数,例如 replace()DataFrame["columname"].str.replace()。如果您想用空替换列中的所有值,您可以使用 DataFrame["columname"] = ''

,

您的方法是矫枉过正,因为使用 iterrows 迭代数据帧很慢,因为它遍历所有行(每一行都包含所有列),而您实际上只想将替换应用于一列。

我的建议是使用仅应用于要替换的列的 lambda 函数:

df['column'] = df['column'].apply(lambda x: x.replace('replacethis','withthis'))

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。