有没有什么办法用C#读取PDF中表格的特定列

问题描述:

我有一个PDF,它有一个有6列的表格。我只需要提取表格中3列的内容。这可能使用itext sharp吗?有没有什么办法用C#读取PDF中表格的特定列

+0

是表标签? – mkl

你不能用itext直接做。你应该写somde代码来解析文本到你用pdf或者任何其他库从pdf读取的html文件。

这里有一些有用的链接;

https://www.codeproject.com/questions/734458/convert-pdf-to-html-using-csharp-open-source-libra

c# converting pdf to html

http://aspdotnetcodebook.blogspot.com.tr/2008/08/how-to-convert-pdf-file-to-text-in.html