微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何从段落中提取日期字符串“2019 年 3 月 11 日 • 3:26AM”并将其转换为 python 中的日期时间格式 (dd/mm/yy)

如何解决如何从段落中提取日期字符串“2019 年 3 月 11 日 • 3:26AM”并将其转换为 python 中的日期时间格式 (dd/mm/yy)

我有一个段落,其中包含我需要提取并单独列的日期和评论等详细信息。该段落位于我从中提取日期的列中,如下所示:

'故事\n常见问题\n更新 2\n评论 35\n作者:Antaio Inc\n2019 年 3 月 11 日 • 凌晨 3:26\n2 年前\n感谢大家的精彩开始!\n大家好,\n我们只想感谢你们一切都是为了一个很棒的开始!这是我们有史以来第一次 Indiegogo 活动,我们非常感谢您的支持,帮助我们取得了成功。\n在接下来的一段时间内,我们将致力于制作和运送很棒的 A-Buds 和 A-Buds东南。我们计划在下个月按照承诺将它们运送给您。\n我们将在接近关键生产日期时发送更多更新。\n敬请期待!\n此致,\nAntaio 团队\n来自 Antaio Inc\n2019 年 1 月 31 日• 凌晨 5:15\n 2 年前\n预生产更新\n亲爱的,\n我们想借此机会感谢大家对我们的早期支持。你们好棒! :)\n你可能已经注意到了,A-Buds 已经进入生产阶段,这意味着我们已经完成了所有的开发和测试,现在正在进行预生产。活动结束后,您不仅会收到经过全面测试和认证的出色 A-Buds,我们还承诺按时交付!我们真的很高兴能在您手中拥有这些出色的真正蓝牙 5.0 耳塞。我们相信你会爱上它们!\n所以这里是一个快速的先睹为快:\n更多。敬请关注! :)\n来自:Antaio 团队\n阅读更多'

此类段落出现在数据集的每一行中名为“Project_Updates_Description”的特定列中。我正在尝试提取每个条目中的第一个日期

我目前使用的代码是:

for i in df['Project_Updates_Description']:
if type(i) == str: 
    print(count)
    word = i.split('\n',7)
    count+=1
    if len(word) > 5:
        print(word[5])
        df['Date'] = word[5]

我现在遇到的问题是,当我从段落中提取日期时,我将其作为字符串获取作为字符串,当我尝试将它附加到新的“日期”列中时,我一直为所有条目获取相同的日期。有人能告诉我我做错了吗?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。