微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

c# – XPath / HtmlAgilityPack:如何找到具有属性(href)特定值的元素(a)并找到相邻的表列?

我非常绝望,因为我无法弄清楚如何实现我在问题中所说的内容.我已经读过无数类似的例子,但没有找到一个在确切情况下工作的例子.所以,假设我有以下代码
<table><tr>
<td><a href="url-a">text A</a></td><td><a>id A</a></td><td><a>img A</a></td>
<td><a href="url-b">text B</a></td><td><a>id B</a></td><td><a>img B</a></td>
<td><a href="url-c">text C</a></td><td><a>id C</a></td><td><a>img C</a></td>
</tr></table>

现在,我已经拥有的是url-a的一部分.我基本上想知道如何获得id和img A.我试图用XPath“找到”这条线但是我无法找到一种方法来使它工作.此外,信息可能根本不存在.这是我最近的一次尝试(严重的是,我现在已经尝试了很多不同的方式,已经超过3个小时了):

if (htmlDoc.DocumentNode.SelectSingleNode(@"/a[contains(@href,'part-url-a')]") != null)
    string ida = htmlDoc.DocumentNode.SelectSingleNode(@"/a[contains(@href,'part-url-a')]/following-sibling::a").InnerText;

嗯,这显然是错的,所以如果有人可以帮助我,我会很高兴.另外我很感激,如果有人可以通过这样的例子向我指出一些解释XPath和符号/语法的网站.书籍也欢迎.

PS:我知道我可以在没有XPath的情况下实现我的目标,使用Regex或只是简单的C#中的StreamReader,并检查每行是否包含我需要的内容但是a)它太脆弱了我的需求,因为代码可能有突然的换行符b)我真的想要坚持完全坚持使用XPath来完成我在这个项目中所做的任何事情.

在此先感谢您的帮助!

解决方法

使用以下XPath表达式:
/*/tr/td[a[@href='url-a']]
                /following-sibling::td[1]
                     /a/text()

根据提供的(格式错误但已更正的)XML文档进行评估时:

<table><tr>
<td><a href="url-a">text A</a></td><td><a>id A</a></td><td><a>img A</a></td>
<td><a href="url-b">text B</a></td><td><a>id B</a></td><td><a>img B</a></td>
<td><a href="url-c">text C</a></td><td><a>id C</a></td><td><a>img C</a></td>
</tr></table>

选择了想要的文本节点:

id A

同样,这个XPath表达式:

/*/tr/td[a[@href='url-a']]
                /following-sibling::td[2]
                     /a/text()

当针对相同的XML文档(上面)进行评估时,选择另一个想要的文本节点:

img A

基于XSLT的验证:

在XML文档上应用此转换时(上图):

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>

 <xsl:template match="/">
  <xsl:copy-of select=
   "/*/tr/td[a[@href='url-a']]
                /following-sibling::td[1]
                     /a/text()"/>

  <xsl:text>&#10;</xsl:text>
  <xsl:copy-of select=
   "/*/tr/td[a[@href='url-a']]
                /following-sibling::td[2]
                     /a/text()"/>
 </xsl:template>
</xsl:stylesheet>

产生了想要的结果:

id A
img A

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


原文地址:http://msdn.microsoft.com/en-us/magazine/cc163791.aspx 原文发布日期: 9/19/2005 原文已经被 Microsoft 删除了,收集过程中发现很多文章图都不全,那是因为原文的图都不全,所以特收集完整全文。 目录 前言 CLR启动程序
前言 随着近些年微服务的流行,有越来越多的开发者和团队所采纳和使用,它的确提供了很多的优势也解决了很多的问题,但是我们也知道也并不是银弹,提供优势的同时它也给我们的开发人员和团队也带来了很多的挑战。 为了迎接或者采用这些新技术,开发团队需要更加注重一些流程或工具的使用,这样才能更好的适应这些新技术所
最近因为比较忙,好久没有写博客了,这篇主要给大家分享一下PLINQ中的分区。上一篇介绍了并行编程,这边详细介绍一下并行编程中的分区和自定义分区。 先做个假设,假设我们有一个200Mb的文本文件需要读取,怎么样才能做到最优的速度呢?对,很显然就是拆分,把文本文件拆分成很多个小文件,充分利用我们计算机中
在多核CPU在今天和不久的将来,计算机将拥有更多的内核,Microsoft为了利用这个硬件特性,于是在Visual Studio 2010 和 .NET Framework 4的发布及以上版本中,添加了并行编程这个新特性,我想它以后势必会改变我们的开发方式。 在以前或者说现在,我们在并行开发的时候可
c语言输入成绩怎么判断等级
字符型数据在内存中的存储形式是什么
c语言怎么求字符串的长度并输出
c语言函数的三种调用方式是什么
c语言中保留两位小数怎么表示
double的输入格式符是什么