将文档转换为html格式

问题描述:

为了解释我的问题,我将解释我在做什么。将文档转换为html格式

我正在做我最后的项目在uni,我不想浪费我的时间,所以我想知道这是否可能。

我有一个数字取证报告,由每位调查员填写,并在案件进行之前交给案件官员审查。我想通过创建一个可以将调查人员记录并将其放在表单中的html表单来简化它。

这可能吗?

+0

这是什么?数字报告可能意味着一个Word文档,关闭等。你是否希望有一个网页形式的前端,并在某些时候提交的数据转到数字文件? –

+0

即时消息Word文档。 –

根据您的目标范围以及您之前是否已经构建了一个Web应用程序,构建这​​样的应用程序是完全可能的,且不需要太多模糊处理。

如果您只需要通过网络表单上传文件,这些文件将被附加到最终文件(可能是一个PDF格式,将在网站上呈现),这样案件干事审查的工作就会减少为他可以滚动浏览,这可能已经完成了这项工作。

由于您不是在询问手写识别或OCR,您似乎没有关于如何做到这一点的任何规范? 你也有一个遗留系统,你将不得不整合你的应用程序?或者它是一个绿地项目,您还可以自己构建“html表单”?

但是,您应该让您的主管完成他们的工作并让他们为您正确定义应用范围。

否则,当您尝试识别文档上的所有文字(不仅仅是块文字),必须支持一打输入格式(不仅仅是pdf)时,这可能会通过范围蔓延变成无处不在的故事......

+0

我的主管是垃圾,我一直在自己做这件事,我很困惑。我试图改变,但不被允许。我希望能够构建我以前做过一次的html表单,然后尝试做一些与它不同的事情,这样可以节省调查者在全部输入时的时间。也许链接到案例的数据库,并做下拉框和几个文本框来讨论他们正在处理的案例。 如果任何这对你有意义,那么我实际上可以做到这一点 –

+0

@ShannonGilbert解析Office文档= neckshotting自己。有关这是为什么,请参阅http://www.joelonsoftware.com/items/2008/02/19.html。这是可能的,但你需要Windows服务器技能(IIS)。你也许应该看一下PDF文件,但情况也相当糟糕。 '.csv'文件(不是.xlsx或.xls!)对你来说是最简单的解决方案。 – sjas