尝试使用BeautifulSoup
问题描述:
凑到网会员
所以我试着去凑这个用户天寒对他的评价酒店&餐馆分别 https://www.tripadvisor.in/members-reviews/rahuls896尝试使用BeautifulSoup
现在的问题是,它显示我在默认情况下所有的评论时,即时通讯通过BeautiFulsoup阅读它。因此,默认情况下,class =“active”被分配给“REVIEWS_ALL”。
<li data-filter="REVIEWS_ALL" class="active">All</li>
<li data-filter="REVIEWS_HOTELS">Hotels (1)</li>
<li data-filter="REVIEWS_RESTAURANTS">Restaurants (1)</li>
但我想的类= “活动”被分配到“REVIEWS_HOTELS”
<li data-filter="REVIEWS_ALL">All</li>
<li data-filter="REVIEWS_HOTELS" class="active">Hotels (1)</li>
<li data-filter="REVIEWS_RESTAURANTS">Restaurants (1)</li>
我怎样才能做到这一点的自动化?
答
只要尝试为用户提取整个内容,然后按照您的要求进行隔离。
from selenium import webdriver
driver = webdriver.Firefox()
driver.get('https://www.tripadvisor.in/members-reviews/rahuls896')
next_button = driver.find_element_by_id("cs-paginate-next")
next_button.click()
+0
Thanks thats足够开始使用!!!!! :-) – shalini
它看起来像不同的评论的选择过程是在页面加载后通过JavaScript完成的,所以我不知道你是否可以完全通过美丽的汤做到这一点。您可能需要查看刮刮JavaScript内容 – Craicerjack
@Craicerjack您能帮助我究竟是什么吗?如果您说的任何内容都可以通过BS本身来实现?事情是我找不到任何链接到该选择的JS。你能帮我解决这个问题吗? – shalini
它看起来像过滤器过程是通过主干完成的。如果评论全部返回所有评论,你可能会过滤他们后,他们。除此之外,看看刮到Javascript内容 – Craicerjack