scrapy从javascript提取源代码url
问题描述:
我正在尝试从javascript提取数据。 JS貌似 -scrapy从javascript提取源代码url
<script type="text/javaScript">
var playerInstance = jwplayer("player");
playerInstance.setup({
image: "http://cdn1.gomoviesgo.com/movies/1230451279-cover-Wonder-Woman.jpg",
sources: JSON.parse('[{"file":"http:\/\/stream.gomo.to\/home\/movies\/tt0451279.mp4","label":"720<sup>HD<\/sup>"}]'),
width: "100%"
});
</script>
我需要图像URL是http://cdn1.gomoviesgo.com/movies/1230451279-cover-Wonder-Woman.jpg
和源地址是"http:\/\/stream.gomo.to\/home\/movies\/tt0451279.mp4"
请指导。
答
您不能使用html解析器解析js,但可以使用正则表达式。可以使用内置的re
方法。
image = response.css('script::text').re('image:\s*"(.*?)",')[0]
file = response.css('script::text').re('"file":"(.*?)",')[0].replace('\\', '')
什么是你的问题? – Siphalor
我如何获得这些数据。无法实现代码。 –
是你的蟒蛇吗?你是否将'javascript.js'作为一个纯文本文件存放在你的scrapper中? –