C# 提取PPT文本和图片的实现方案
2021-05-02 06:28
标签:min res 初始化 start 文件夹 代码 nload com 图片 在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。首先也是需要安装组件Spire.Presentation,然后添加引用dll文件到项目中。下面是主要的代码步骤。 原文档:
1. 提取文本 步骤一:创建一个Presentation实例并加载文档 步骤二:创建一个StringBuilder对象 步骤三:遍历幻灯片及幻灯片中的图形,提取文本内容 步骤四:写入Txt文档 2. 提取图片 这里提取图片有两种情况,一种是提取整个文档中的所有图片,另外一种是只提取文档中某一特定幻灯片中的图片。 2.1提取所有图片 步骤一:初始化一个Presentation类实例,并加载文档 步骤二:遍历文档中图片,提取图片并保存 提取的图片已保存到项目文件夹下 2.2.提取特定幻灯片中的图片 步骤一:创建一个Presentation类实例,并加载文档 步骤二:获取第三张幻灯片,提取并保存图片 提取的第三张幻灯片中的图片已保存至指定位置 上文演示了如何提取文本和图片,步骤比较简单实用,希望对你有所帮助,感谢阅读! 如需转载请注明出处。 C# 提取PPT文本和图片的实现方案 标签:min res 初始化 start 文件夹 代码 nload com 图片 原文地址:http://www.cnblogs.com/Yesi/p/7770802.htmlPresentation presentation = new Presentation(@"C:\Users\Administrator\Desktop\sample.pptx", FileFormat.Pptx2010);
StringBuilder sb = new StringBuilder();
foreach (ISlide slide in presentation.Slides)
{
foreach (IShape shape in slide.Shapes)
{
if (shape is IAutoShape)
{
foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
{
sb.Append(tp.Text + Environment.NewLine);
}
}
}
}
File.WriteAllText("target.txt", sb.ToString());
Process.Start("target.txt");
Presentation ppt = new Presentation();
ppt.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");
for (int i = 0; i )
{
Image image = ppt.Images[i].Image;
image.Save(string.Format(@"..\..\Images{0}.png", i));
}
Presentation PPT = new Presentation();
PPT.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");
int i = 0;
foreach (IShape s in PPT.Slides[2].Shapes)
{
if (s is SlidePicture)
{
SlidePicture ps = s as SlidePicture;
ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png", i));
i++;
}
if (s is PictureShape)
{
PictureShape ps = s as PictureShape;
ps.EmbedImage.Image.Save(string.Format("{0}.png", i));
i++;
}
}
上一篇:c# 笔记cookie
下一篇:C# 实现AES加密--解密
文章标题:C# 提取PPT文本和图片的实现方案
文章链接:http://soscw.com/index.php/essay/81220.html