使用jsoup获取元素的文本而不包含子元素的文本
问题描述:
我正在使用jsoup来解析HTML。有这样的列表项目:使用jsoup获取元素的文本而不包含子元素的文本
<li><span class="chk">X</span>Category Name</li>
我想要得到的文本不包括跨度的文本。所以我想得到“类别名称”没有“X”。 (如果我在li元素上调用text()
方法,则会得到“XCategory Name”。)如何排除子跨度?
答
ownText()方法将帮助你在这里。
Document document = Jsoup.parse("<ul><li><span class=\"chk\">X</span>Home</li><li><spanclass=\"chk\">X</span>Category Name</li></ul>");
Elements elems = document.select("li");
for(Element elem : elems){
System.out.println(elem.ownText());
}
谢谢!正是我在找什么 – froadie 2014-11-06 06:52:59