我可以在目标页面解析HTML并跳转到其中的链接吗?

问题描述:

我的问题的简短版本是,是否可以编写代码,而不是打开页面,而是解析该页面并在其上打开链接?我已阅读了一些关于使用PHP或Perl或其他工具来解析HTML的内容;这是可以用这样的工具来完成的吗?我可以在目标页面解析HTML并跳转到其中的链接吗?

我维护一些包含指向特定语言文档的固定列表的链接的页面。格式是沿着这与注释掉行线(以通用的方式)一致如果该文档尚未发布:

<ul> 
    <li><a href="(en_US link)">English</a></li> 
    <!-- <li><a href="(bg_BG link)">Bulgarian</a></li> --> 
    <!-- <li><a href="(zh_CN link)">Chinese - Simplified</a></li> --> 
    <li><a href="(zn_TW link)">Chinese - Traditional</a></li> 
    ... etc. 
</ul> 

别人已经指向这些页面。

鉴于其中之一并了解所需语言,他们是否可以在页面中找到该链接并跳转到该页面,而不是将该行注释掉?编写正则表达式很容易,因为这些嵌入式URL都以xx_XX.pdf结尾,使用任何语言/语言环境。

我不想弄清楚代码会是什么,只是如果他们有合适的工具和正确的知识就可以编写这些代码。

+0

答案的简短版本是肯定的,除了原始页面必须被提取*以及*链接页面。没有办法知道一个页面链接到哪个URL而没有先获取它 – Borodin

+0

没有必要在Stack Overflow的代码段中使用HTML实体。我们使用[*** Markdown ***]版本(https://daringfireball.net/projects/markdown/),并且在[*** Markdown编辑帮助***](http:/ /*.com/editing-help) – Borodin

+0

对不起 - 我试图描述这些模式如何在这些链接中保持一致,并且认为这样可以更容易形象化。 – user5464905

你不给非常多的细节,但没错,听起来这是可能的

传统上,PHP是一个服务器端的语言,而Perl是更经常在客户端使用。这将是实现这个Web服务器系统上的坏主意,但如果你正在考虑一个HTTP 客户那么它是在几乎任何语言的可行

如果你不明白客户端之间的区别服务器然后请询问

+0

谢谢。这不会在我的最终实现,我不知道另一方是什么样子 - 我只知道他们访问我的网页作为用户交易的一部分(呈现从我身边接受的条款作为下载的一部分) 。我告诉第三方,我会试着找出是否有可能做这样的事情,尽管我不会那么做。我想这可能是可能的,而且其实很简单,但它超出了我基本的HTML知识。我会让他知道有一些工具可以帮助它,并让他去处理需要在另一端实施它的人。 – user5464905