itext - pdf to html
问题描述:
我花了大约20个小时的编码在c#中使用iText制作发票。 现在,我想使用相同的代码将一些表格转换为html。itext - pdf to html
你知道,如果我能做到这一点?
比如我有这样的:
PdfPTable table = new PdfPTable(3);
table.DefaultCell.Border = 0;
table.DefaultCell.Padding = 3;
table.WidthPercentage = 100;
int[] widths = { 100, 200, 100};
table.SetWidths(widths);
List listOfCompanyData = (List)getCompanyData();
List listOfCumparatorDreaptaData = (List)getCumparatorDreaptaData(proformaInvoice.getCumparatorDreapta());
table.AddCell((Phrase)listOfCompanyData.Items[0]);
table.AddCell("");
table.AddCell((Phrase)listOfCumparatorDreaptaData.Items[0]);
,我想这个表格转换为HTML ...
这可能吗?
答
PDF和HTML是根本不同的显示技术。 PDF比HTML更复杂,这就是为什么你找到这么多的HTML到PDF转换器。另一种方式更困难。
iText的只能做从HTML不过是PDF。
有onlineconverters,将采取一个PDF文件,并转换成HTML。还有downloadable实用程序。
我不知道任何.NET库,将做到这一点的。
答
从书的iText在行动似乎它使用原始的Java库是可行的,但它似乎并不像它在C#中的lib不再停靠。我敢肯定它是版本4: -/
尝试看看一些旧的源代码在这里:http://www.koders.com/csharp/fid60B0985D3A89152128B73F54EDD4EB5420A5E4D8.aspx?s=%22Ken+Auer%22
答
nFOP + XSLT + XML = PDF | doc | HTML
nfop.sourceforge.net/article.html应该给你如何,你需要“微软的Visual J#NET再发行组件包”运行nFOP
开源无成本:)
使用它的想法K
答
PDF几乎是只写格式。任何时候你的工作流程要求“从PDF中获取数据”,你可能已经搞砸了。
话虽如此,有几种方法为PDF内藏匿的数据:
- 表单字段没有特别的长度限制,并需要是不可见的。使用iText获取表单数据是微不足道的。
- 您可以将文件附加到PDF并稍后使用iText将其吸出。
- DocInfo字段。您可以将字符串填入作者/标题/关键字/ etc元数据字段之一中。一个丑陋的黑客,但很有效。
- XML元数据。 “新建的”元数据存储在XML模式中。你可以在那里放置任何你想要的东西...虽然iText在每次改变时都会重新生成一些(mod date等)。
- 自定义键/值。您可以将任何旧的键/值对放入PDF中的任何旧字典中。 Adobe希望您为自定义标签注册公司特定的前缀以避免冲突,但我从未感受到需要。
是的,我只是看着存储库。它的版本标记为4.1.6。我不知道为什么它不再存在。 – asgerhallas 2010-05-15 18:43:35