通过java获取网页
问题描述:
我需要获取给定的网页,然后将HTML标记转换为XML标记,并从这些XML标记中创建一棵树。我怎样才能做到这一点 ??请告诉我一些很好的链接或基于这些教程,顺便说一句,我使用的是Java语言。通过java获取网页
谢谢。
我需要获取给定的网页,然后将HTML标记转换为XML标记,并从这些XML标记中创建一棵树。我怎样才能做到这一点 ??请告诉我一些很好的链接或基于这些教程,顺便说一句,我使用的是Java语言。通过java获取网页
谢谢。
您是否尝试过但都写任何代码? HTML通常包含无效的分层XML内容。这不是一件容易的事。 – 2011-04-29 18:54:11