将PDFToImage提取嵌入图像也 - pdfbox?
问题描述:
会不会PDFToImage
命令也做图像提取?将PDFToImage提取嵌入图像也 - pdfbox?
我想给PDF
文件转换为Image
(PDFBOX)
我使用PDF格式的图像文件转换PDFToImage
命令,但我丢失了所有嵌入式图像PDF当我跑PDFToImage
。
或者是否需要单独运行提取图像以提取PDFFiles中的图像?
有没有其他办法来实现这一目标?
在此先感谢...
答
PDFToImage
被转换的PDF页面到每页图像,输出一个图像。 您正在寻找提取PDF文档的所有嵌入式图像的ExtratImages
。
更多有关ExtractImages
在那里可以找到:
http://pdfbox.apache.org/apidocs/org/apache/pdfbox/ExtractImages.html
为了更具体地回答你的问题,这两个方案做不同的事情。您可以重新编码一个收集这两个功能的程序,或者单独运行它们。
PDFToImage具有误导性,因为它实际上只是将文本提取到新图像中。这实际上并未将整个PDF转换为图像... – mmcrae 2015-02-17 23:33:32