基于页脚使用apache poi或docx4j分离docx

问题描述:

我有一个很大的docx文件,我想将其分割为一个新的docx,只包含页脚,其中包含“附录B”单词的页面,我可以有一些代码示例或任何帮助。基于页脚使用apache poi或docx4j分离docx

+0

在发布问题之前,您应该至少尝试一边。 https://*.com/help/how-to-ask – 2017-10-10 10:14:30

你可以有一个算法:

  1. 检查页脚找到哪些含有感兴趣的话。请注意rels部分中的relId指向这样的页脚。
  2. 现在通过主文档部分,看看sectPr元素。查找包含relId(s)的sectPr元素。请注意,它可能是隐含的(与以前相同)。

提供您的页脚适用于相关的部分(S)的每一页,那么你可以删除该内容之前和之后,然后保存生成的docx。

+0

你是什么意思与“rels”和“relld” –

+0

谷歌'openxml解释类型:pdf'并阅读Wouter的书。 – JasonPlutext