如何在使用TagSoup解析时保持换行?
问题描述:
我的问题非常简单和简短: 有没有什么方法可以使用JSoup来提取文本以保持换行? 当我使用.text()方法时,所有
标签似乎都被忽略。如果我将
标记替换为“\ n”并再次解析为.text()输出,则这些换行符也将被忽略。 那么,这是可行的吗?或者我应该实现我自己的东西,还是尝试使用其他HTML解析器?如何在使用TagSoup解析时保持换行?
在此先感谢!
答
你可以清理你的HTML,只留下<br>
和<p>
标签(或仅<br>
),然后只是替换该标签“\ n”