菜鸟的学习日记总结(九)上传word文档中的文件
想要导入Word文档中的文件一般来说都要将文件设置成按照它所指定的的样板中的格式,而一般指定的模板的样式都会在上传文件之前会要求下载,在根据模板中的样式设置好Word文件后就可以将其上传了。上传文件之前首先要对它进行判断,获取到上传文件的拓展名,判断它是否为Word文档。
在确定上传文件为Word文档后就可以进行下一步的步骤了,先将Word文档重新命一个名
在完成上面的步骤之后就可以正式上传文件了,首先需要将上传的Word文件保存到指定的位置,在保存到指定的路径之前需要先判断路径存不存在,如果不存在保存的指定路径就需要将保存的路径创建出来,然后再进行保存。
将需要上传的Word文件保存到指定的文件夹后,接下来就需要将Word文档的格式转化为HTML格式。转化时需要将设置好转化成HTML文件后的名称,后缀名记得需要替换为 .HTML。在将Word文件转化HTML文件后需要重新命名一个文件夹然后将其保存到指定的路径。
在将Word文档的格式的文件转化为HTML的格式的时候使用到了一个名为 Spire.Doc的类库,
根据老师上课时所说可知 Spire.Doc for .NET是一款由E-iceblue公司开发的专业的Word .NET类库,使用该工具开发人员可以在任意.NET平台(C#,VB.NET,ASP.NET)上快速创建,读取,写入,转换,打印Word文档。作为一个独立的Word 组件,Spire.Doc的运行无需安装Microsoft Word。而且,它可以将Microsoft Word文档创建功能集成到开发者的任何.NET应用程序Spire.Doc.for .NET 是一个专业的word .NET库 ˈspaɪə® 。在创建好保存文件的文件夹之后就可以将HTML格式的文件保存到指定的路径了。
将上传的HTML文件保存到指定文件后就可以对其进行操作了,通过对其设置正则表达式等对其进行筛选,将需要的数据筛选出来然后上传到页面。
在通过正则表达式等方法将需要的数据筛选出来后就需要将筛选出来的数据保存下来。
在完成上面使用的操作之后就可以将Word文档的文件上到页面了。
下图分别为上面所使用的获取p标签里面内容和处理带图片的p标签的方法