从父锚获取href HtmlUnit

从父锚获取href HtmlUnit

问题描述:

我想要做的是使用HtmlUnit从跨度的父锚获取href。这是我的意思。从父锚获取href HtmlUnit

<a href="http://link.com/serv?id=jibberish&type=dynamic/changeseachvisit"><span>Some Unique Text</span></a> 

没有ID或名字与任一或标签相关的,通过这个例子那么回事,你怎么会找到其他类似的海洋无标识或名称该链接? 谢谢!

+0

你使用链接的平均来识别呢? – VirtualTroll 2011-05-13 14:54:08

+0

是的,你可以,但是这个链接有连接到它的查询字符串参数,它们是动态的(每次访问网站时都会改变,并且基于访问者是谁 – 2011-05-13 15:05:42

+0

我不知道htmlunit或者api的样子,但我想你可以直接在js中或通过java api来遍历DOM,所以必须有一个“getParent()”方法 – 2011-05-13 15:12:26

使用XPath //span[contains(.,'Transcript')]/parent::a/@href

(非测试,但XPATH肯定是要走的路)

+0

isnt XPATH仅适用于XML吗? – 2011-05-13 15:17:15

+0

不,绝对不是......你可以在HTMLUnit中使用XPATH,我已经使用了很多,XPath是我的首选方法,在HTMLUnit [Getting Started](http://htmlunit.sourceforge.net) /gettingStarted.html),您有一段名为'查找特定元素',其中指出:“XPath是更复杂搜索的建议方式” – Grooveek 2011-05-13 15:20:39

+0

我是XPATH的新手,我试过.... page.getByXPath(“ //包含(。,'Transcript')/ parent :: a [@href]“)。get(0).toString()...有很多错误,比如”unknown nodetype:contains“ – 2011-05-13 15:31:30