scrapy从javascript提取源代码url

问题描述：

我正在尝试从javascript提取数据。 JS貌似 -scrapy从javascript提取源代码url

<script type="text/javaScript"> 
var playerInstance = jwplayer("player"); 
playerInstance.setup({ 
    image: "http://cdn1.gomoviesgo.com/movies/1230451279-cover-Wonder-Woman.jpg", 
    sources: JSON.parse('[{"file":"http:\/\/stream.gomo.to\/home\/movies\/tt0451279.mp4","label":"720<sup>HD<\/sup>"}]'), 
    width: "100%" 
}); 
</script>

我需要图像URL是http://cdn1.gomoviesgo.com/movies/1230451279-cover-Wonder-Woman.jpg和源地址是"http:\/\/stream.gomo.to\/home\/movies\/tt0451279.mp4"

请指导。

什么是你的问题？ – Siphalor

我如何获得这些数据。无法实现代码。 –

是你的蟒蛇吗？你是否将'javascript.js'作为一个纯文本文件存放在你的scrapper中？ –

答

您不能使用html解析器解析js，但可以使用正则表达式。可以使用内置的re方法。

image = response.css('script::text').re('image:\s*"(.*?)",')[0] 
file = response.css('script::text').re('"file":"(.*?)",')[0].replace('\\', '')

scrapy从javascript提取源代码url

相关推荐