微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

正则表达式截取URL参数

最近在写个爬虫,要去爬一些网站获得数据,这个过程中遇到字符串截取的问题,超哥指点了我,帮了个大忙啊

http://regexpal.com/还有http://www.regexr.com/这两个网站可以测试你的正则表达式~

除此之外,谷歌浏览器的开发者工具也很好用,F12后在console里面可以直接进行操作

例如:http://market.scau.edu.cn/goods.PHP?iid=1407246132s7jn1j8b&iaction=view&st=0f 这样一个字符串,我要取得 iid

在console里面输入 var item ="http://market.scau.edu.cn/goods.PHP?iid=1407246132s7jn1j8b&iaction=view&st=0f"

item.match(/iid=([0-9a-z]+)&iaction=(\w+)&st=(\w+)/)

会返回["iid=1407246132s7jn1j8b&iaction=view&st=0f",1407246132s7jn1j8b"view"0f"] 这样一个数组

利用捕获可以简单方便得获得想要的字符。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐