python爬取b站,超水的,不喜勿喷(喷也喷写高情商的)

python爬虫爬取b站(只有部分可以)

  1. 打开b站番剧例如紫罗兰第二集:https://www.bilibili.com/bangumi/play/ep173287
    打开网址,暂停,别播放(没vip也播放不了)
    打开开发者工具,网络(我用的edge)clear

python爬取b站,超水的,不喜勿喷(喷也喷写高情商的)
红色右边那个,在点击播放,会产生一堆这种文件python爬取b站,超水的,不喜勿喷(喷也喷写高情商的)
第一个和第三个分别是该视频的图像和音频,双击可以下载,成为m4s文件,合并:2个改成mp4文件,用格式工厂将音频的mp4转为mp3,再合流就可以了(但不知道为什么很大,昨天下了个一方通行的一集,音视频相加才200m,合并后就600+,把我心爱的轻薄本差点烧穿,cpu直逼90度)也可以音视频一起放,只要同步,观看体验也ok
but:有些例如罪恶王冠我找不到
附加:也可以用idm下载,就不知道观看体验怎样了

本想用get_seeds来分析下,结果发现太深奥了,作为一个学校要求学习C++,还自学python不到一个月的我太难了,求放过,紫罗兰的有特殊机制,我搞不懂;但例如一方通行的我有些法子

像一方通行的里面存在个get_nodes,里面的origin,referer,user_agent,作为headers,用相应的方法访问url(但这个url会改变,周期不清楚)我此时的url为(这个url对全集通用,就headers中的referer改变)
{https://api.yfscdn.net/v1/node/get_nodes?url=https%3A%2F%2Fupos-dash-mirrorks3u.bilivideo.com%2Fupgcxcode%2F46%2F49%2F117784946%2F117784946-1- 30080.m4s%3Fexpires%3D1588496100%26platform%3Dpc%26ssig%3DLQhq6rUoTGK0HDyDKMgJVA%26oi%3D1974391829%26trid%3D3f9f9c90fb55436ea19610664afe02a1p%26nfc%3D1%26nfb%3DmaPYqpoel5MI3qOUX6YpRA%3D%3D%26mid%3D422757572%26logo%3D80000000%26uatag%3Dyfsdk%401.2.7&upt=c22fed6a1588485469&ak=bilibili11hjgHGJH3ghy78gG}
其中的30080换为300280就是音频或者是视频(2者之间另一个,我忘了)response就是{“ok”:true,“data”:{“ips”:{“cnodes”:[],“snodes”:[]},“urls”:{“cnodes”:[],“snodes”:[]}}},
最后一个snodes里面会存有相应的下载地址,能get下来
python爬取b站,超水的,不喜勿喷(喷也喷写高情商的)
最后推荐想要尝试的先写好代码,在导入当前的url(我写的期间,url又改变了)能用代理就用(被封ip怎么办)
轻薄本就不推荐用格式共仓合并了

作为大一新生以及第一篇就感谢了