如何解决curl:填写网页表单并检索内容
我想使用 bash 脚本自动填写网站上的 web 表单:http://www.epncb.oma.be/_productsservices/coord_trans/index.php,并从输出文本框中检索结果。
我试过了:
curl -d from_frame_in="values" -d from_epoch_year="values" -d from_epoch_decimal="values" -d inputvalues="values" -d to_frame_out="values" -d to_epoch_year="values" -d to_epoch_decimal="values" -d transform_button="values" "$websiteurl"
。
然而,epoch drop list没有被选中,只有frame drop list和input text box有值。
我也试过:
wget --post-data 'from_frame_in=values&from_epoch_year=values&from_epoch_decimal=values&inputvalues=values&to_frame_out=values&to_epoch_year=values&to_epoch_decimal=values&transform_button=values' "$websiteurl"
。
这个脚本可以让所有的下拉列表和输入文本框得到值。 但是对于上面提到的两种方法,我不知道如何从输出文本框中检索计算结果。
如果有人能帮我解决这个问题或为我指明解决此类问题的方向,我将不胜感激。
解决方法
请格式化您的问题。
在例如打开页面Chrome,点击 F12,标签网络,点击转换(在你的网页上)。在网络选项卡中向上滚动并右键单击 index.php - 复制 - 复制为 cURL (bash) 剥离垃圾后你应该得到:
curl -s 'http://www.epncb.oma.be/_productsservices/coord_trans/index.php' --data-raw 'from_frame_in=ETRF89&from_epoch_year=2000&from_epoch_decimal=0&from_epoch_year2=2000&from_epoch_doy=001&from_epoch_date=2000-01-01&from_epoch_week=1042&from_epoch_dow=6&inputvalues=%23+Lines+starting+by+%23+are+treated+as+comments%0D%0A%23+Fields+%28in+decimal+format%29+should+be+separated+by+at+least+one+space%0D%0A%23%0D%0A%23+--%3E+Example+without+velocity+-+StationName%28no+space+character%29+X%5Bm%5D+Y%5Bm%5D+Z%5Bm%5D+%3A%0D%0AStationName+4027894.006+307045.600+4919474.910%0D%0A%23%0D%0A%23+--%3E+Example+with+velocity+-+StationName%28no+space+character%29+X%5Bm%5D+Y%5Bm%5D+Z%5Bm%5D+VX%5Bm%2Fyr%5D+VY%5Bm%2Fyr%5D+VZ%5Bm%2Fyr%5D+%3A%0D%0AStationName+4027894.006+307045.600+4919474.910+0.01+0.2+0.03%0D%0A&to_frame_out=ETRF89&to_epoch_year=2000&to_epoch_decimal=0&to_epoch_year2=2000&to_epoch_doy=001&to_epoch_date=2000-01-01&to_epoch_week=1042&to_epoch_dow=6&outputvalues=StationName+4027894.00600++307045.60000+4919474.91000+%C2%A0+%C2%A0+%C2%A0%0D%0AStationName+4027894.00600++307045.60000+4919474.91000++0.01000++0.20000++0.03000%0D%0A&epochtype=decimalyear&transform_button=Transform' --compressed --insecure | xmllint --html --xpath "//textarea[@name='outputvalues']/text()" - 2>/dev/null
StationName 4027894.00600 307045.60000 4919474.91000
StationName 4027894.00600 307045.60000 4919474.91000 0.01000 0.20000 0.03000
-s
静音curl 进程,xmllint --html --xpath
解析xpath 中curl 和clip 元素的输出(xmllint 可以通过sudo apt install libxml2-utils
安装),-
告诉xmllint 使用stdin/pipe从 curl 而不是文件,2>/dev/null
将错误输出重定向到地狱 - 摆脱解析错误的讨厌方法
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。