如何解决关于使用请求登录网站的另一个问题
我被困住了。在尝试从登录页面首次登录后,我尝试着找到每个使用Python 3的Requests库访问网页的示例。这里的缺点是,我正在尝试创建一个工作工具,因此无法提供指向所使用的确切网页的链接,但可以显示该页面中的源代码以提供帮助。希望有人可以告诉我我在这里提供的东西需要做什么?
我认为我坚持的是,有一个名为“ __RequestVerificationToken”的隐藏输入,该输入随每次新登录页面加载/刷新而动态变化,我知道这需要“发布” ”和登录凭据,但是到目前为止,我看过的每个教程都按以下步骤进行操作:
- 使用Requests和BS4首先访问并解析登录页面的源代码,并找到唯一的令牌值
- 使用该唯一令牌值发送发布请求
但问题是(我认为),这两个请求之间的令牌值发生了变化,从而使第一个请求过时了。
页面凭据部分的源代码(以及我不确定是否需要某种加密功能,但无论如何都包含了它)如下所示。它运行时没有“错误”,但登录后我要访问的页面看起来与登录页面代码相同,表示登录未成功:
[![Login_Creds] [1]] [1]
<form action="/Login" id="form-login" method="post"><input name="__RequestVerificationToken" type="hidden" value="3s5_lA2VJBP3XTpl_YE3zkxcZarbGUuCZfHbm0oJ3nvQweIKorZXnein-YBQnrouX9VVLVc0qw2gvOVIE8-IxLdd9kALEFVpb4RA4z1Ed7k1" /> <div id="message-sessionexpired" class="usermessage-login ui-widget-content ui-corner-all h-column" style="display: none">
<div class="v-column first">
<i class="ci-icon-info-sign ci-icon" id="128824"></i>
</div>
<div class="v-column last">
We thought you left,so for your security we signed you out.
Please sign back in below.
</div>
</div>
<div id="message-userloggedout" class="usermessage-login ui-widget-content ui-corner-all h-column" style="display: none">
<div class="v-column first">
<i class="ci-icon-info-sign ci-icon table-cell" id="128825"></i>
</div>
<div class="v-column last">
You signed in with a different user in a new tab.
Please use the new tab or sign back in below.
</div>
</div>
<table>
<tr>
<td>
<label for="login-email">User Name (email)</label>
</td>
<td>
<input class="input-login" id="login-email" name="email" type="text" value="" />
</td>
</tr>
<tr>
<td>
<label for="login-password">Password</label>
</td>
<td>
<input autocomplete="on" class="ci-textbox input-login" id="login-password" name="password" type="password" value="" />
</td>
</tr>
<tr>
<td colspan="2" style="text-align: center">
<input id="login-passhash" name="passhash" type="hidden" value="" />
</td>
</tr>
<tr>
<td colspan="2" style="text-align: right">
<button class="ci-button" id="button-login" title="Version 4.4.86.17690" type="submit" value="Login">Login<script for="button-login" temporary="true" type="text/javascript">button_login=new Button("#button-login",{disabled:!1});$(function(){button_login.init();$("#button-login").off("click.centralui");$("#button-login").on("click.centralui",function(n){$(this).is(":disabled")||n.isDefaultPrevented()||$("#form-login").loader().show({message:"",focusInput:!1});$(this).is(":disabled")||n.isDefaultPrevented()||encryptPassword()})})</script></button>
</td>
</tr>
<tr>
<td colspan="2">
<a class="smaller" href="/ResetPassword?Length=5" id="link-forgotpassword">Forgot your password?</a>
</td>
</tr>
<tr>
<td colspan="2">
</td>
</tr>
</table>
<br />
<div class="validation-summary-valid" data-valmsg-summary="true"><ul><li style="display:none"></li>
</ul></div></form>
<script type="text/javascript">
$(function () {
if (sessionStorage.expired == "true") {
$("#message-sessionexpired").css("display","flex");
sessionStorage.expired = false;
}
if (sessionStorage.userLoggedOut == "true") {
$("#message-userloggedout").css("display","flex");
sessionStorage.userLoggedOut = false;
}
});
function encryptPassword() {
var clearPass = $("#login-password").val();
$("#login-passhash").val(null);
var publicKeyExponent = Base64.decode("EXPONENT_STRING_HERE");
if (publicKeyExponent != false) {
var publicKeyModulus = Base64.decode("DECODE_STRING_IS_HERE");
var publicKey = new RSAPublicKey(publicKeyModulus,publicKeyExponent);
var encryptedPass = RSA.encrypt(clearPass,publicKey);
$("#login-passhash").val(encryptedPass);
$("#login-password").val(null);
}
}
</script>
到目前为止,我尝试过的代码是:
import requests
from bs4 import BeautifulSoup
USERNAME = 'USERNAME'
PASSWORD = 'PASSWORD'
LOGIN_URL = "BASEURL/Login" # /Login from the "<form action" part of login source code
PRIVATE_URL = "BASEURL/PAGE_AFTER_LOGIN"
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/IP_HERE Safari/537.36'}
def main():
sess = requests.session()
# Get login "hidden_token" first
html = sess.get(LOGIN_URL)
soup = BeautifulSoup(html.content,'html.parser')
hidden_token = soup.find('input',{'name': '__RequestVerificationToken'}).get('value')
# Create payload
payload = {
"username": USERNAME,"password": PASSWORD,"__RequestVerificationToken": hidden_token
}
# Perform login
html = sess.post(LOGIN_URL,data=payload,headers=headers)
# Scrape url
html = sess.get(PRIVATE_URL,headers=headers)
print(html) # Response
print(html.text) # Source Code for after logged in page
if __name__ == '__main__':
main()
给定这些数据,除了使用硒之外,还有什么可以尝试的想法?同样,我无法提供确切的URL,只是在寻找一些指导。谢谢!
更新 经过一番挖掘之后,事实证明,我的猜想是正确的,当我从第一个“ get”请求和“ post”请求中打印出cookie时,“ __ RequestVerificationToken”是不同的。那么,有什么方法可以通过“ post”命令提交令牌值吗? [1]:https://i.stack.imgur.com/85yAO.png
解决方法
我想您对令牌在请求之间更改这一事实的预感是正确的。
最有可能基于cookie生成一个新令牌。如果服务器看到一个新用户(也就是一个新的会话cookie),它将生成另一个__RequestVerificationToken
。
每种登录方式都不同,但是我建议您尝试以下操作
GET(login_url) -> extract cookies from response object,extract __RequestVerificationToken
POST(login_url,data = (user,passw,token),cookies = extracted_cookies) -> extract cookies again
当您发布具有相同Cookie的请求时,也许服务器不会更改令牌。
登录后,再次提取cookie并进行比较。 (有时服务器会在您登录后 后分配一组新的Cookie)。祝你好运!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。