如何解决无法使用 python 中的机械化登录我究竟做错了什么?
我正在尝试在 python 中使用 mechanize 登录此站点:https://login.haaretz.co.il/ 从表面上看,它看起来像一个两阶段的登录过程,与谷歌相同,但通过机械化登录谷歌的收据让我无处可去。在 submit()-ing 之后,浏览器似乎保持在同一页面上,其中包含单个 userName 控件的单个表单。 我做错了什么?
>>> import mechanize
>>> br = mechanize.browser()
>>> br.open('https://login.haaretz.co.il/')
<response_seek_wrapper at 0x7f53bfbc4a00 whose wrapped object = <closeable_response at 0x7f53bfbc4580 whose fp = <_io.BufferedReader name=3>>>
>>>
>>> br.select_form(nr=0)
>>>
>>> print(br.form)
<GET https://login.haaretz.co.il/ application/x-www-form-urlencoded
<TextControl(userName=)>
<IgnoreControl(<None>=<None>)>>
>>> br['userName']='my_email@gmail.com'
>>> resp = br.submit()
>>> # and after submitting I'm back a square one
>>> print(br.forms()[0])
<GET https://login.haaretz.co.il/?userName=my_email%40gmail.com application/x-www-form-urlencoded
<TextControl(userName=)>
<IgnoreControl(<None>=<None>)>>
>>>
这是没有希望了吗?我做错了吗?
解决方法
我的猜测是登录过程依赖于 JavaScript。如果登录依赖于 JavaScript,您将无法通过 Mechanize 获得想要的结果。见Mechanize and Javascript
xpath 'body/script[2]'
处的脚本标签有一个带有 'loginSuccess': False
键值对的 JavaScript 对象。因此我的猜测是登录需要 JavaScript。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。