C# 提取PDF文本和图片
2021-07-12 09:10
标签:doc ring ice end pre app href builder sys 【示例 1 】提取文本 文本提取效果: 图片提取效果: C# 提取PDF文本和图片 标签:doc ring ice end pre app href builder sys 原文地址:http://blog.51cto.com/eiceblue/2171752
所需工具:
实现代码:
using Spire.Pdf;
using System;
using System.IO;
using System.Text;
namespace ExtractText
{
class Program
{
static void Main(string[] args)
{
//加载文档
PdfDocument document = new PdfDocument();
document.LoadFromFile("测试文档.pdf");
//实例化StringBuilder类,获取文本
StringBuilder content = new StringBuilder();
content.Append(document.Pages[0].ExtractText());
//保存提取后的文本内容到.txt文档
String fileName = "TextFromPDF.txt";
File.WriteAllText(fileName, content.ToString());
System.Diagnostics.Process.Start("TextFromPDF.txt");
}
}
}
【示例 2 】提取图片using System;
using System.Collections.Generic;
using System.Text;
using System.Drawing;
using Spire.Pdf;
namespace ExtractImagesFromPDF
{
class Program
{
static void Main(string[] args)
{
//实例化PdfDocument类,并加载测试文档
PdfDocument doc = new PdfDocument();
doc.LoadFromFile("测试文档.pdf");
//实例化List类
List
上一篇:windows 安装进化