从Scrapinghub下载项目的源代码

问题描述:

我有一个项目部署在Scrapinghub,我根本没有任何该代码的副本。从Scrapinghub下载项目的源代码

如何从Scrapinghub下载我的本地主机上的整个项目代码?

我可以使用它来下载项目代码

shub fetch-eggs project_id_here 

哪里project_id_here可以从浏览器的网址打开项目时被抓住。

生成的文件将是一个*.egg只需使用WinRAR或任何其他您使用的工具将其提取为ZIP文件。

据我所知,目前还没有公共API用于在Scrapy Cloud上检索项目源代码。 (如果错误,请纠正我。)
但确实有可能在没有附加特权的情况下检索项目源代码。

当作业运行时,与项目相关的文件定位在/app路径:

job-<some-job-id>:/app$ ls -la /app                                                                        
total 48                                                                              
drwxr-xr-x 5 root root  4096 Jul 27 17:13 .                                                                    
drwxr-xr-x 82 root root  4096 Jul 28 04:09 ..                                                                    
-rw-r--r-- 1 root root 26695 Jul 27 17:13 __main__.egg                                                                 
drwxr-xr-x 2 nobody nogroup 4096 May 23 07:34 addons_eggs                                                                 
drwxr-xr-x 2 nobody nogroup 4096 Jul 24 14:27 python                                                                   
-rw-r--r-- 1 root root  14 Jul 24 14:27 requirements.txt 

该文件__main__.egg包含所有项目的源代码。

因此,您可以:

  1. 选择一个当前正在运行的任务,在访问它的控制台:https://app.scrapinghub.com/p/[project_id]/[spider_id]/[job_id]/console
  2. 发送.egg文件放到你可以在以后检索,例如curl http://IP-address-of-your-own-server:8888/retrieve-file --data-binary @/app/__main__.egg(假设您已准备好接收数据的服务)。

另外,我想你总是可以联系Scrapinghub支持寻求帮助。