Jsoup解析器(简易网络爬虫)
今天太晚了就发一个简单的小例子吧
利用Jsoup解析器来解析html页面,也算一个小爬虫吧
public void Select() throws Exception {
//1.解析html文本,获取document对象
Document document = Jsoup.parse(new URL("https://www.runoob.com/"), 1000);
//通过标签查找元素
Elements elements = document.select("div");
for(Element element : elements){
System.out.println(element.text());
}
}
此处我们用菜鸟教程来当作例子
菜鸟教程
结果如图:
篇幅太长就不一一截图了,此次爬取的标签是div标签,感兴趣的小伙伴赶快试试吧。