微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在大型文本文件中的两个唯一单词之间提取信息

如何解决如何在大型文本文件中的两个唯一单词之间提取信息

您可以为此使用正则表达式

>>> st = "alpha here is my text bravo"
>>> import re
>>> re.findall(r'alpha(.*?)bravo',st)
[' here is my text ']

我的test.txt文件

alpha here is my line
yipee
bravo

现在使用open读取文件,而不是应用regular expressions

>>> f = open('test.txt','r')
>>> data = f.read()
>>> x = re.findall(r'alpha(.*?)bravo',data,re.DOTALL)
>>> x
[' here is my line\nyipee\n']
>>> "".join(x).replace('\n',' ')
' here is my line yipee '
>>>

解决方法

我大约有150个文本文件,其中填充了字符信息。每个文件包含两个唯一词()alpha和bravo,我想提取这些唯一词之间的文本并将其写入不同的文件中。

手动地,我可以按住CTRL + F来输入两个单词,并在两个单词之间复制文本,我只想知道如何使用一个程序(最好是Python)来处理许多文件。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。