如何从网站获取哈希值?

问题描述:

我是一个python新手。我目前正在进行基本的网络抓取。在浏览几个GitHub项目时,我发现了一个让用户下载srt文件的例子。如何从网站获取哈希值?

以下是疑问。假设url是这样的:

http://www.opensubtitles.org/en/subtitles/6528547/silicon-valley-the-lady-bs 

如何获得随机哈希值6528547?在附注中,我请求了关于如何开始使用API​​的提示

+0

使用['urlparse'(https://docs.python.org/2/library/urlparse.html#urlparse.urlsplit)找到了'path'。在该字符串上,执行'.split('/')'。可能不完美,但很不错。 –

+0

如果你希望能够在你访问该页面之前获得该散列,你不能预测散列值,因为它是与特定事物相关的索引ID,在这种情况下是电影。如果你想在你已经知道URL的时候得到哈希,你可以像@BrianCain建议的那样做。 – aneroid

+0

下面的代码,该项目used.def get_hash(FILE_PATH): read_size = 64 * 1024 张开(FILE_PATH, 'RB')为f: 数据= f.read(read_size) f.seek(-read_size ,os.SEEK_END) data + = f.read(read_size) return hashlib.md5(data).hexdigest()
我认为它是使用一些API来获取散列值 –

假设你有url并且只想获得“hash”,获得hash的最简单方法是使用'/ '作为参数,然后返回列表的第5个元素。

url = "" #suppose you have the url here 
hash = url.split('/')[5] 

Screenshot