Instagram Web抓取追随者
问题描述:
我想在Instagram中提取随机网页的追随者。我试图将python与Beautiful Soup结合使用。Instagram Web抓取追随者
不过我还没有收到在网页的任何信息,在那里我可以访问
def get_user_info(user_name):
url = "https://www.instagram.com/" + user_name + "/?__a=1"
try:
r = requests.get(url)
except requests.exceptions.ConnectionError:
print ('Seems like dns lookup failed..')
time.sleep(60)
return None
if r.status_code != 200:
print ('User: ' + user_name + ' status code: ' + str(r.status_code))
print (r)
return None
info = json.loads(r.text)
return info['user']
get_user_info("wernergruener")
如前所述我不明白的页面的追随者。我怎么能这样做?
干杯, 安迪
答
随着API/JSON:
我不熟悉Instagram的API,但它并不像它返回一个人的追随者的详细信息,只追随者的数量。
您应该能够使用info["user"]["followed_by"]["count"]
获取该信息。
随着原材料页/美丽的汤:
假设非API页面显示你想了解一个人的追随者的信息,你要下载的原始的HTML(而不是JSON),并对其进行解析使用美丽的汤。
def get_user_info(user_name):
url = "https://www.instagram.com/" + user_name
try:
r = requests.get(url)
except requests.exceptions.ConnectionError:
print ('Seems like dns lookup failed..')
time.sleep(60)
return None
if r.status_code != 200:
print ('User: ' + user_name + ' status code: ' + str(r.status_code))
print (r)
return None
soup = BeautifulSoup(r.text, 'html.parser')
# find things using Beautiful Soup
get_user_info("wernergruener")
美丽的汤有一些我读过的最直观的文档。我想从那里开始: https://www.crummy.com/software/BeautifulSoup/bs4/doc/
随着API /蟒蛇,Instagram的:
其他人已经做了很多繁重的你的。我认为python-instagram应该为您提供更容易访问您想要的信息。
我试过在'wernergruener'中搜索instagram,然后空着。那是确切的名字吗? –