如何从网站获取哈希值？

问题描述：

我是一个python新手。我目前正在进行基本的网络抓取。在浏览几个GitHub项目时，我发现了一个让用户下载srt文件的例子。如何从网站获取哈希值？

以下是疑问。假设url是这样的：

http://www.opensubtitles.org/en/subtitles/6528547/silicon-valley-the-lady-bs

如何获得随机哈希值6528547？在附注中，我请求了关于如何开始使用API的提示

使用['urlparse'（https://docs.python.org/2/library/urlparse.html#urlparse.urlsplit）找到了'path'。在该字符串上，执行'.split（'/'）'。可能不完美，但很不错。 –

如果你希望能够在你访问该页面之前获得该散列，你不能预测散列值，因为它是与特定事物相关的索引ID，在这种情况下是电影。如果你想在你已经知道URL的时候得到哈希，你可以像@BrianCain建议的那样做。 – aneroid

下面的代码，该项目used.def get_hash（FILE_PATH）： read_size = 64 * 1024 张开（FILE_PATH， 'RB'）为f：数据= f.read（read_size） f.seek（-read_size ，os.SEEK_END） data + = f.read（read_size） return hashlib.md5（data）.hexdigest（）
我认为它是使用一些API来获取散列值 –

答

假设你有url并且只想获得“hash”，获得hash的最简单方法是使用'/ '作为参数，然后返回列表的第5个元素。

url = "" #suppose you have the url here 
hash = url.split('/')[5]

Screenshot

如何从网站获取哈希值？

相关推荐