python爬取b站，超水的，不喜勿喷（喷也喷写高情商的）

python爬虫爬取b站（只有部分可以)

打开b站番剧例如紫罗兰第二集：https://www.bilibili.com/bangumi/play/ep173287
打开网址，暂停，别播放（没vip也播放不了）
打开开发者工具，网络（我用的edge）clear

python爬取b站，超水的，不喜勿喷（喷也喷写高情商的）
红色右边那个，在点击播放，会产生一堆这种文件
第一个和第三个分别是该视频的图像和音频，双击可以下载，成为m4s文件，合并：2个改成mp4文件，用格式工厂将音频的mp4转为mp3，再合流就可以了（但不知道为什么很大，昨天下了个一方通行的一集，音视频相加才200m，合并后就600+，把我心爱的轻薄本差点烧穿，cpu直逼90度）也可以音视频一起放，只要同步，观看体验也ok
but:有些例如罪恶王冠我找不到
附加：也可以用idm下载，就不知道观看体验怎样了

本想用get_seeds来分析下，结果发现太深奥了，作为一个学校要求学习C++，还自学python不到一个月的我太难了，求放过，紫罗兰的有特殊机制，我搞不懂；但例如一方通行的我有些法子

像一方通行的里面存在个get_nodes，里面的origin，referer,user_agent,作为headers，用相应的方法访问url（但这个url会改变，周期不清楚）我此时的url为（这个url对全集通用，就headers中的referer改变）
{https://api.yfscdn.net/v1/node/get_nodes?url=https%3A%2F%2Fupos-dash-mirrorks3u.bilivideo.com%2Fupgcxcode%2F46%2F49%2F117784946%2F117784946-1- 30080.m4s%3Fexpires%3D1588496100%26platform%3Dpc%26ssig%3DLQhq6rUoTGK0HDyDKMgJVA%26oi%3D1974391829%26trid%3D3f9f9c90fb55436ea19610664afe02a1p%26nfc%3D1%26nfb%3DmaPYqpoel5MI3qOUX6YpRA%3D%3D%26mid%3D422757572%26logo%3D80000000%26uatag%3Dyfsdk%401.2.7&upt=c22fed6a1588485469&ak=bilibili11hjgHGJH3ghy78gG}
其中的30080换为300280就是音频或者是视频（2者之间另一个，我忘了）response就是{“ok”:true,“data”:{“ips”:{“cnodes”:[],“snodes”:[]},“urls”:{“cnodes”:[],“snodes”:[]}}}，
最后一个snodes里面会存有相应的下载地址，能get下来
python爬取b站，超水的，不喜勿喷（喷也喷写高情商的）
最后推荐想要尝试的先写好代码，在导入当前的url（我写的期间，url又改变了）能用代理就用（被封ip怎么办）
轻薄本就不推荐用格式共仓合并了

作为大一新生以及第一篇就感谢了

python爬取b站，超水的，不喜勿喷（喷也喷写高情商的）

python爬虫爬取b站（只有部分可以)

相关推荐