我正在努力机械化.我希望“点击”一组链接,这些链接只能通过它们的位置(div#content中的所有链接)或它们的href来识别.
我已经尝试过上述两种识别方法但没有成功.
从文档中,我无法弄清楚如何根据它们在DOM中的位置返回链接集合(用于单击),而不是直接在链接上返回属性.
其次,documentation建议你可以使用:href来匹配部分href,
page = agent.get('http://foo.com/').links_with(:href => "/something")
但我唯一可以让它返回链接的方法是传递一个完全限定的URL,例如
page = agent.get('http://foo.com/').links_with(:href => "http://foo.com/something/a")
如果我想返回带有href的链接集合,这不是很有用
http://foo.com/something/a http://foo.com/something/b http://foo.com/something/c etc...
难道我做错了什么?我有不切实际的期望吗?
解决方法
第二部分
您传递给的值:href默认情况下必须是完全匹配.因此,示例中的href仅匹配< a href =“/ something”>< / a>而不是< a href =“foo.com/something/a”>< / a>
您传递给的值:href默认情况下必须是完全匹配.因此,示例中的href仅匹配< a href =“/ something”>< / a>而不是< a href =“foo.com/something/a”>< / a>
你想要做的是传入一个正则表达式,以便它匹配href字段中的子字符串.像这样:
page = agent.get('http://foo.com/').links_with(:href => %r{/something/})
编辑:
第一部分
要使其仅在链接中选择链接,请在字符串中添加nokogiri样式的搜索方法.像这样:
page = agent.get('http://foo.com/').search("div#content").links_with(:href => %r{/something/}) # **
好吧,这不起作用,因为在你执行page = agent.get(‘http://foo.com/’).search(“div #content”)后,你会得到一个Nokogiri对象而不是机械对象,所以links_with不起作用.但是,您将能够使用css方法从Nokogiri对象中提取链接.我会建议像:
page = agent.get(‘http://foo.com/’).search(“div#content”).css(“a”)
如果这不起作用,我建议查看http://nokogiri.org/tutorials
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。