快速采集微信公众号文章教程

 使用简数采集微信公众号文章,非常简单,只需输入:公众号ID或名称或者关键词。

使用步骤:

  1. 新建微信公众号采集任务
  2. 微信公众号采集任务配置
  3. 采集结果
  4. 采集微信公众号注意事项
  5. 附录(如何获取公众号ID和微信文章零散采集)

 

1. 新建微信公众号采集任务:

  新建微信公众号采集任务有两个入口:

  • 在控制台左侧 “采集任务管理” 列表中,点击 “采集微信公众号”;

  • 在创建任务栏目处,点击 “+微信公众号”;

快速采集微信公众号文章教程

 

2. 微信公众号采集任务配置:

  • 填写任务名 、选择采集方式(按公众号ID(微信号)或者关键词)、输入对应值、采集页数和日期范围,保存,即可启动抓取。

      可以填写多个微信号ID或关键词,用逗号,分隔即可(半角逗号),建议一个任务填写的微信号或关键词个数不要超过20个;

  • ‘数据处理(可选)’ 处可做一些简单数据处理,删除图片或链接,添加版权说明等;

  • 微信公众号采集的原始图片是无法正常显示的(防盗链),如需图片,请在“图片下载配置”中,选择暂存简数或阿里云OSS或七牛存储;

快速采集微信公众号文章教程

 

3. 采集结果:

  默认采集字段:

  微信公众号名称(weixin_name),公众号ID(weixin_id),标题(title),正文(content),发布日期(pubData),作者(author),标签(tag),描述(description,可使用正文截取)和关键字(keywords);

快速采集微信公众号文章教程

 

采集微信公众号注意事项:

  • 使用采集方式 ‘按公众号ID(微信号)’ 时,建议填写公众号ID(获取方式可看附录),采集成功率会更高;

  • 本平台是通过搜狗微信搜索获取到文章的,因此采集会受搜狗影响,包括时效性、可采集数量等;

  • 微信公众号采集的原始图片是无法正常显示的(防盗链),如需图片,请在“图片下载配置”中,选择暂存简数或阿里云OSS或七牛存储;

  • 采集到的原文链接是临时的,过期后不可访问;

  • 采集页数和内容日期范围,有些时候会无效;

  • 因代理IP有时不可用或网络状态影响,简数不保证一定可以采集到数据,没采集到数据建议重试几次;(数据没采集到是不会产生费用)

 

附录:(如何获取公众号ID和微信文章零散采集)

 

I、如何获取公众号ID

  在 ‘公众号ID(微信号)’ 处填写微信号名称,再点击旁边的 ‘核查公众号’ 按钮,即可看到微信号;

  下面以 ‘环球网’ 为例:

快速采集微信公众号文章教程

快速采集微信公众号文章教程

快速采集微信公众号文章教程

 

II、微信文章零散采集

  微信文章零散采集一般用于精准采集,用户只需输入微信文章地址即可采集。

  在微信公众号文章采集的基本信息页面,点击 ‘手动输入文章链接采集(可选)’ 按钮;

  提示:如果需要下载图片,数据处理等,请先配置后再点击零散采集按钮;

快速采集微信公众号文章教程


  输入单个或多个详情网址,一行一个,以http://https://开头;

快速采集微信公众号文章教程