lxml - 如何获得HtmlElement的xpath?

问题描述:

使用XML etree,这是可以做到的:lxml - 如何获得HtmlElement的xpath?

etree.getpath(element

我怎么会做同样的事情,但随着HTML而不是XML?

_ElementTree的具有getpath方法:

In [17]: import lxml.html as LH 
In [18]: content = '<root><div id="pgbrk" ......>....Page Break....</div></root>' 

In [19]: root = LH.fromstring(content) 

In [20]: tree = root.getroottree() 

In [21]: tree.getpath(root[0]) 
Out[21]: '/html/body/root/div' 
+0

洛尔救生员。我自己实现了这个功能。 – 2014-10-10 17:33:44