零代码爬虫——Web Scraper入门
简介
Web Scraper 旨在让每个人都能轻松爬取Web数据,而无需编程。
缺点
- 无法进行复杂爬取
安装
任意选择:
推荐阅读:Chrome插件安装方法
初试
- 百度任意搜索关键词
-
F12 开发者工具 → Web Scraper
- 创建站点:Create new sitemap → Create Sitemap
- 添加选择器:Add new selector → Id 任意 → 选中 Multiple → Select → 在页面上点击爬取目标,多点几个让浮动框内容变简单 → Done selecting! → Element preview 或 Data preview 预览查看是否想要的数据 → Save selector
- 爬取内容&导出数据:Sitemap xxx → Scrape → Start scraping → 弹出页面等待爬取完毕 → Sitemap xxx → Export data as CSV
跳转
- 创建站点:测试商品页面
- 一级菜单:Id 填
category-link
→ Type 设为Link
→ 选中 Multiple - 二级菜单:点进子节点 → Id 填
subcategory-link
→ Type 设为Link
→ 选中 Multiple - 添加链接选择器:点进 Laptops → 点进子节点 → Add new selector → Id 填
product-link
→ Type 设为Link
→ 选中 Multiple → Select - 商品链接:任意进入一商品 → 点进子节点 → Id 填
title
→ Type 设为Text
→ 这次不选 Multiple
类似添加price
备注
- Move developer tools to the bottom of your browser to start using Web Scraper.
把开发者工具拖长 或 点右上角三个点并置于底部