微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

C# OpenXML:仅在除最后一个之外的所有文件中获取文件中的第一个超链接

如何解决C# OpenXML:仅在除最后一个之外的所有文件中获取文件中的第一个超链接

我被指派编写一个应用程序,该应用程序可以进入目录、查找某种类型的文件获取文件中的任何超链接并记录它们。到目前为止,一切都很顺利。但是,出于某种原因,我遇到了问题,只能获取文件中的两个链接之一。两个链接都指向同一个网址。它似乎忽略了前两个文件中的第二个,但第三个就好了。

        string pathtofolder = "C:\\Users\\Icmolreulf\\source\\repos\\FileSearch\\FileSearch\\powershelltesting";

        string[] files = System.IO.Directory.GetFiles(pathtofolder,"*.docx");
        Console.WriteLine(files.Length);

        for (int i = 0; i < files.Length; i++)
        {
            WordprocessingDocument word = WordprocessingDocument.Open(files[i],true);
            IEnumerable<HyperlinkRelationship>  link = from x in word.MainDocumentPart.HyperlinkRelationships where (x.RelationshipType == "http://schemas.openxmlformats.org/officeDocument/2006/relationships/hyperlink") select x;
            foreach (HyperlinkRelationship l in link)
            {
                if (isValidURL(l.Uri.ToString()))
                {
                    Console.WriteLine(l.Uri.ToString());
                }
            }
        }
    static bool isValidURL(string uriName)
    {
        Uri uriResult;
        bool result = Uri.TryCreate(uriName,UriKind.Absolute,out uriResult)
            && (uriResult.Scheme == Uri.UriSchemeHttp || uriResult.Scheme == Uri.UriSchemeHttps);

        return result;
    }

我不知道问题可能是什么。我希望找到的所有文件的 url 都是相同的:http://burymewithmymoney.com/。我已经确保它在所有这些中。我还尝试将另一个 .docx 文件添加到目录中,它可以工作,但它也忽略了该文件。我真的很感激我能得到的任何帮助。

解决方法

问题出在我正在读取的文件上。代码工作正常。很抱歉占用您的时间。祝您度过愉快的一天。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。