通过html中的页面迭代
我的目的是遍历页面,通过点击每个页面,然后从中获取一些信息。我使用硒作为Python。我的问题是,我无法找到任何链接/ href,我应该点击HTML中的页面。通过html中的页面迭代
这就是HTML的样子。我找到了pageNum的列表,但是当我点击它们时,出现错误。当我更仔细地查看HTML时,发现我没有并链接到那里。那我该怎么办?
正如你可以看到,下面,我添加了一些更多的HTML,“表单方法”。我也在HTML中找到它。也许它会有所帮助。当我比较页面的不同href时,它们由这个模块组成。
<a class="pageNum" rel="1" >1</a>
<a class="pageNum" rel="2" >2</a>
<a class="pageNum" rel="3" >3</a>
<a class="pageNum" rel="4" >4</a>
<a class="pageNum" rel="5" >5</a>
<a class="pageNum" rel="6" >6</a>
<a class="pageNum" rel="7" >7</a>
<a class="pageNum" rel="8" >8</a>
<a class="pageNum" rel="9" >9</a>
<a class="pageNum" rel="10" >10</a>
<a class="pageNum" rel="11" >11</a>
<a class="pageNum" rel="12" >12</a>
<a class="pageNum" rel="13" >13</a>
<a class="pageNum" rel="14" >14</a>
<a class="pageNum" rel="15" >15</a>
<form method="get" id="searchParams" action="https://www.ida.org.il/">
<input type="hidden" name="pageType" value="19"/>
<input type="hidden" name="langId" value="1"/>
<input type="hidden" name="currPage" value="20"/>
<input type="hidden" name="paramIds" value=",321,322,354,355,320"/>
<input type="hidden" name="scope" value=""/>
<input type="hidden" name="parameterSearch" value=""/>
</form>
下面你可以看到,我想重复的列。
即使没有href
属性,您仍然可以单击页码并重定向。使用rel
属性
page_number = 2
driver.find_element_by_css_selector('[rel="' + page_number + '"]').click()
我有page_number问题。这是一个数字,我应该把那里的字符串。 Python给我写了一个错误。 –
@KDDExpert,所以只需使用字符串,而不是'page_number ='2'' – Guy
单击手动执行操作时单击的元素。 – Guy
元素是“pageNum”,但正如您从附加的html中看到的那样,没有href/link。也许有Java Script功能,当我点击“pageNum”时创建href。 –