C# 使用 iTextSharp 将 PDF 转换成 TXT 文本

2022年9月16日 04:50 • 编程笔记

var pdfReader = new PdfReader("xxx.pdf");
StreamWriter output = new StreamWriter(new FileStream("处理结果.txt", FileMode.Create));

int pageCount = pdfReader.NumberOfPages;
for (int pg = 1; pg <= pageCount; pg++)
{
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
var value = PdfTextExtractor.GetTextFromPage(pdfReader, pg, strategy);
value = value.Replace(" ", "");
Console.WriteLine(value);
output.Write(value);
}

output.Flush();
output.Close();
Console.Write("处理完毕");
Console.ReadLine();


https://www.cnblogs.com/New-HackerHK/p/14853693.html

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/289731.html

c int iTextSharp new pdf pdfReader PG StreamWriter www

CMU15-445 FALL 2022 PROJECT #0 – C++ PRIMER (Trie) 实验笔记

上一篇 2022年9月16日

.NET(C#) ExcelLibrary读写Excel

下一篇 2022年9月16日

发表回复

登录后才能评论

C# 使用 iTextSharp 将 PDF 转换成 TXT 文本

相关推荐

发表回复