尝试使用BeautifulSoup

问题描述:

凑到网会员

所以我试着去凑这个用户天寒对他的评价酒店&餐馆分别 https://www.tripadvisor.in/members-reviews/rahuls896尝试使用BeautifulSoup

现在的问题是,它显示我在默认情况下所有的评论时,即时通讯通过BeautiFulsoup阅读它。因此,默认情况下,class =“active”被分配给“REVIEWS_ALL”

<li data-filter="REVIEWS_ALL" class="active">All</li> 
<li data-filter="REVIEWS_HOTELS">Hotels (1)</li> 
<li data-filter="REVIEWS_RESTAURANTS">Restaurants (1)</li> 

但我想的类= “活动”被分配到“REVIEWS_HOTELS”

<li data-filter="REVIEWS_ALL">All</li> 
<li data-filter="REVIEWS_HOTELS" class="active">Hotels (1)</li> 
<li data-filter="REVIEWS_RESTAURANTS">Restaurants (1)</li> 

我怎样才能做到这一点的自动化?

+0

它看起来像不同的评论的选择过程是在页面加载后通过JavaScript完成的,所以我不知道你是否可以完全通过美丽的汤做到这一点。您可能需要查看刮刮JavaScript内容 – Craicerjack

+2

@Craicerjack您能帮助我究竟是什么吗?如果您说的任何内容都可以通过BS本身来实现?事情是我找不到任何链接到该选择的JS。你能帮我解决这个问题吗? – shalini

+0

它看起来像过滤器过程是通过主干完成的。如果评论全部返回所有评论,你可能会过滤他们后,他们。除此之外,看看刮到Javascript内容 – Craicerjack

只要尝试为用户提取整个内容,然后按照您的要求进行隔离。

from selenium import webdriver 
driver = webdriver.Firefox() 
driver.get('https://www.tripadvisor.in/members-reviews/rahuls896') 
next_button = driver.find_element_by_id("cs-paginate-next") 
next_button.click() 
+0

Thanks thats足够开始使用!!!!! :-) – shalini