如何解决如何解析或找到不同行中的字符串?
我是Web爬网的新手,我尝试通过使用字符串作为查找内容的工具来解析文件中的某些内容。该字符串包含多个单词,在文件中,该字符串已分为两行。
我编写的代码无法再找到字符串。我已经尝试过rstrip()
和replace()
函数,但是它们都不起作用。示例如下。图片
是一个文本文件,在其中突出显示了我尝试找到的字符串"PRINCIPAL STOCKHOLDER"
。如图所示,该字符串已分成两行,并且由于找不到该字符串,因此代码返回为空。
以下代码不起作用:
text_locate = 'PRINCIPAL STOCKHOLDER'
text = (str(text_locate).replace('\r','').replace('\n',''))
解决方法
尝试一下:
text = text_locate.strip().replace("\n","")
,
您已尝试使用xpath,使用起来非常简单:
https://www.accordbox.com/blog/scrapy-tutorial-7-how-use-xpath-scrapy/
如果您不想这样做,仍然可以这样做:
https://thispointer.com/python-search-strings-in-a-file-and-get-line-numbers-of-lines-containing-the-string/
也许您应该只寻找PRINCIPAL或STOCKHOLDER,而不要同时寻找两者。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。