在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。首先也是需要安装组件Spire.Presentation,然后添加引用dll文件到项目中。下面是主要的代码步骤。
原文档:
1. 提取文本
步骤一:创建一个Presentation实例并加载文档
Presentation presentation = new Presentation(@"C:\Users\Administrator\Desktop\sample.pptx",FileFormat.Pptx2010);
步骤二:创建一个StringBuilder对象
StringBuilder sb = new StringBuilder();
foreach (ISlide slide in presentation.Slides) { foreach (IShape shape slide.Shapes) { if (shape is IAutoShape) { foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs) { sb.Append(tp.Text + Environment.NewLine); } } } }
步骤四:写入Txt文档
File.WriteallText("target.txt",sb.ToString()); Process.Start(");
这里提取图片有两种情况,一种是提取整个文档中的所有图片,另外一种是只提取文档中某一特定幻灯片中的图片。
步骤一:初始化一个Presentation类实例,并加载文档
Presentation ppt = new Presentation(); ppt.LoadFromFile(");
for (int i = 0; i < ppt.Images.Count; i++) { Image image = ppt.Images[i].Image; image.Save(string.Format(..\..\Images{0}.png提取的图片已保存到项目文件夹下Presentation PPT = Presentation(); PPT.LoadFromFile(");0; foreach (IShape s in PPT.Slides[2].Shapes) { if (s SlidePicture) { SlidePicture ps = s SlidePicture; ps.PictureFill.Picture.EmbedImage.Image.Save({0}.png; } PictureShape) { PictureShape ps = s PictureShape; ps.EmbedImage.Image.Save(; } }
上文演示了如何提取文本和图片,步骤比较简单实用,希望对你有所帮助,感谢阅读!
如需转载请注明出处。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。