itext - pdf to html

问题描述：

我花了大约20个小时的编码在c＃中使用iText制作发票。现在，我想使用相同的代码将一些表格转换为html。itext - pdf to html

你知道，如果我能做到这一点？

比如我有这样的：

PdfPTable table = new PdfPTable(3); 
table.DefaultCell.Border = 0; 
table.DefaultCell.Padding = 3; 
table.WidthPercentage = 100; 
int[] widths = { 100, 200, 100}; 
table.SetWidths(widths); 

List listOfCompanyData = (List)getCompanyData(); 
List listOfCumparatorDreaptaData = (List)getCumparatorDreaptaData(proformaInvoice.getCumparatorDreapta()); 

table.AddCell((Phrase)listOfCompanyData.Items[0]); 
table.AddCell(""); 
table.AddCell((Phrase)listOfCumparatorDreaptaData.Items[0]);

，我想这个表格转换为HTML ...

这可能吗？

答

PDF和HTML是根本不同的显示技术。 PDF比HTML更复杂，这就是为什么你找到这么多的HTML到PDF转换器。另一种方式更困难。

iText的只能做从HTML不过是PDF。

有online converters，将采取一个PDF文件，并转换成HTML。还有downloadable实用程序。

我不知道任何.NET库，将做到这一点的。

答

从书的iText在行动似乎它使用原始的Java库是可行的，但它似乎并不像它在C＃中的lib不再停靠。我敢肯定它是版本4： -/

尝试看看一些旧的源代码在这里：http://www.koders.com/csharp/fid60B0985D3A89152128B73F54EDD4EB5420A5E4D8.aspx?s=%22Ken+Auer%22

是的，我只是看着存储库。它的版本标记为4.1.6。我不知道为什么它不再存在。 – asgerhallas 2010-05-15 18:43:35

答

nFOP + XSLT + XML = PDF | doc | HTML

nfop.sourceforge.net/article.html应该给你如何，你需要“微软的Visual J＃NET再发行组件包”运行nFOP

开源无成本:)

使用它的想法

答

PDF几乎是只写格式。任何时候你的工作流程要求“从PDF中获取数据”，你可能已经搞砸了。

话虽如此，有几种方法为PDF内藏匿的数据：

表单字段没有特别的长度限制，并需要是不可见的。使用iText获取表单数据是微不足道的。
您可以将文件附加到PDF并稍后使用iText将其吸出。
DocInfo字段。您可以将字符串填入作者/标题/关键字/ etc元数据字段之一中。一个丑陋的黑客，但很有效。
XML元数据。 “新建的”元数据存储在XML模式中。你可以在那里放置任何你想要的东西...虽然iText在每次改变时都会重新生成一些（mod date等）。
自定义键/值。您可以将任何旧的键/值对放入PDF中的任何旧字典中。 Adobe希望您为自定义标签注册公司特定的前缀以避免冲突，但我从未感受到需要。

itext - pdf to html

相关推荐