周期在搜索结果页面和解析数据
问题描述:
我只是试图使Python浏览所有网页的网站的搜索结果:周期在搜索结果页面和解析数据
remainder = "latter_part_of_url"
page = '?s=0'
urlstring = 'https://domain/search/' + str(page) + str(remainder)
pagenumber = str(page)+120
for i in range(120, 100000, 120):
# I am trying to increment by 120, how do I do that?
print(urlstring)
答
那不是很简单:
for new_page_num in range(int(page)+120, 100000, 120):
urlstring = 'https://domain/search/' + str(new_page_num) + str(remainder)
我会使用一些字符串格式而不是+虽然。
它如何知道何时停止?当代码在看到最后一页时停止操作的参考点。 –
当您达到100000时,它会停止。这就是范围(..)的工作原理。 – jnvilo