如何使用Asp.net抓取过程来获取网站的所有网址?

问题描述:

如何获取网站的所有网址如何使用Asp.net抓取过程来获取网站的所有网址?

假设我想抓取网站中的某些部分数据,这些数据在不同的网页中如何获取所有网址列表以进入所有这些类似网页。

假设在一个手机网站我想获得一个品牌的所有手机我怎样才能得到他们在网站的不同网址。我观察到Div标签类是所有手机的“品牌名称”

Div类“诺基亚”....我想要div类为诺基亚的网站的URL。

+0

在未经允许的情况下屏幕抓取其他人的数据令人不悦,所以要小心。 – 2011-06-11 17:29:45

+0

不仅“皱眉”,它可能是侵犯版权或其他知识产权,或者像大多数人知道的那样,盗窃。 – 2011-06-11 17:41:47

你可以使用HTML解析器如Html Agility Pack来提取锚,形式的所有URL,...如果该URL不是你解析你将无法在HTML的部分(除猜测)知道给定域名所有可能的子域名和网址。