如何在使用TagSoup解析时保持换行?

问题描述:

我的问题非常简单和简短: 有没有什么方法可以使用JSoup来提取文本以保持换行? 当我使用.text()方法时,所有
标签似乎都被忽略。如果我将
标记替换为“\ n”并再次解析为.text()输出,则这些换行符也将被忽略。 那么,这是可行的吗?或者我应该实现我自己的东西,还是尝试使用其他HTML解析器?如何在使用TagSoup解析时保持换行?

在此先感谢!

你可以清理你的HTML,只留下<br><p>标签(或仅<br>),然后只是替换该标签“\ n”