如何解决修复指向通过PdfMerger添加的指向未来页面的链接
我正在尝试合并一些PDF,其中第一个PDF具有到稍后合并的其他PDF的链接。
我首先将HTML转换为PDF,然后将一些PDF合并到其中。
HTML PDF具有类似这样的简单ancher链接
<a href="#some-id">Click here</a>
<div id="some-id">...</div>
如果通过HtmlConverter.ConvertToDocument
生成PDF时,如果目标ID存在,这将非常有用。
但这是问题所在。稍后将通过PdfMerger
添加目的地。
我尝试使用https://kb.itextpdf.com/home/it7kb/examples/named-destinations
public void AppendPdf(string key,Document sourceDocument,Stream pdfStream)
{
var pdfReader = new PdfReader(pdfStream);
var pdfDocument = new PdfDocument(pdfReader);
pdfDocument.AddNamedDestination(key,pdfDocument.GetFirstPage().GetPdfObject());
var merger = new PdfMerger(sourceDocument.GetPdfDocument());
merger.Merge(pdfDocument,1,pdfDocument.GetNumberOfPages());
var nameTree = sourceDocument.GetPdfDocument().GetCatalog().GetNameTree(PdfName.Dests);
nameTree.SetModified();
}
但无济于事:(
我还尝试检查链接本身,但是GetAsArray
抛出了空值期望
var obj = sourceDocument.GetPdfDocument().GetFirstPage().GetPdfObject();
var annots = obj.GetAsArray(PdfName.Annots); // throws
请帮助:)
编辑
此代码段应使其易于运行
using var stream = new MemoryStream();
var pdfWriter = new PdfWriter(stream);
var pdfDocument = new PdfDocument(pdfWriter);
var key = "future-id";
var html = $@"
<a href=""#some-id"">This link works!</a>
<a href=""#{key}"">Click here to go the first page of the merged PDF,but it does not work</a>
<div id=""some-id"" style=""page-break-before: always;"">Hello PDF</div>
";
var sourceDocument = HtmlConverter.ConvertToDocument(html,pdfDocument,new ConverterProperties());
using var pdfStream = File.OpenRead("path/to/pdf"); // change path to an actual pdf
AppendPdf(key,sourceDocument,pdfStream);
sourceDocument.Close();
var pdfBytes = stream.ToArray();
File.WriteAllBytes("path/to/result.pdf",pdfBytes); // change to desired path
Nuget软件包
<PackageReference Include="itext7" Version="7.1.12" />
<PackageReference Include="itext7.pdfhtml" Version="3.0.1" />
解决方法
在以下三行代码中,无法添加命名的目的地,因为您以只读模式(使用PdfReader
)打开了文档:
var pdfReader = new PdfReader(pdfStream);
var pdfDocument = new PdfDocument(pdfReader);
pdfDocument.AddNamedDestination(key,pdfDocument.GetFirstPage().GetPdfObject());
相反,您应该获取要合并到的源文档中的总页数,而该数字+1是要合并到源文档中的文档第一页的索引,因此应该是输出文档跳转到:
int sourceDocumentPageCount = sourceDocument.GetPdfDocument().GetNumberOfPages();
此外,添加目标有点棘手,因为您需要创建有关如何跳转到页面(位置等)的说明。可以通过以下方式完成:
PdfPage firstPageOfMergedDocument = sourceDocument.GetPdfDocument().GetPage(sourceDocumentPageCount + 1);
sourceDocument.GetPdfDocument().AddNamedDestination(key,PdfExplicitDestination.CreateFit(firstPageOfMergedDocument).GetPdfObject());
完整的AppendPdf
代码为我产生了正确的结果:
public static void AppendPdf(string key,Document sourceDocument,Stream pdfStream)
{
var pdfReader = new PdfReader(pdfStream);
var pdfDocument = new PdfDocument(pdfReader);
var merger = new PdfMerger(sourceDocument.GetPdfDocument());
int sourceDocumentPageCount = sourceDocument.GetPdfDocument().GetNumberOfPages();
merger.Merge(pdfDocument,1,pdfDocument.GetNumberOfPages());
PdfPage firstPageOfMergedDocument = sourceDocument.GetPdfDocument().GetPage(sourceDocumentPageCount + 1);
sourceDocument.GetPdfDocument().AddNamedDestination(key,PdfExplicitDestination.CreateFit(firstPageOfMergedDocument).GetPdfObject());
}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。