从Scrapinghub下载项目的源代码
答
我可以使用它来下载项目代码
shub fetch-eggs project_id_here
哪里project_id_here
可以从浏览器的网址打开项目时被抓住。
生成的文件将是一个*.egg
只需使用WinRAR或任何其他您使用的工具将其提取为ZIP文件。
答
据我所知,目前还没有公共API用于在Scrapy Cloud上检索项目源代码。 (如果错误,请纠正我。)
但确实有可能在没有附加特权的情况下检索项目源代码。
当作业运行时,与项目相关的文件定位在/app
路径:
job-<some-job-id>:/app$ ls -la /app
total 48
drwxr-xr-x 5 root root 4096 Jul 27 17:13 .
drwxr-xr-x 82 root root 4096 Jul 28 04:09 ..
-rw-r--r-- 1 root root 26695 Jul 27 17:13 __main__.egg
drwxr-xr-x 2 nobody nogroup 4096 May 23 07:34 addons_eggs
drwxr-xr-x 2 nobody nogroup 4096 Jul 24 14:27 python
-rw-r--r-- 1 root root 14 Jul 24 14:27 requirements.txt
该文件__main__.egg
包含所有项目的源代码。
因此,您可以:
- 选择一个当前正在运行的任务,在访问它的控制台:https://app.scrapinghub.com/p/[project_id]/[spider_id]/[job_id]/console
- 发送
.egg
文件放到你可以在以后检索,例如curl http://IP-address-of-your-own-server:8888/retrieve-file --data-binary @/app/__main__.egg
(假设您已准备好接收数据的服务)。
另外,我想你总是可以联系Scrapinghub支持寻求帮助。