抓取http网页的全部链接

Asp.net中抓取网页的全部链接

效果图:

抓取http网页的全部链接

后台代码实现:

抓取http网页的全部链接usingSystem;
抓取http网页的全部链接
usingSystem.Collections;
抓取http网页的全部链接
usingSystem.ComponentModel;
抓取http网页的全部链接
usingSystem.Data;
抓取http网页的全部链接
usingSystem.Drawing;
抓取http网页的全部链接
usingSystem.Web;
抓取http网页的全部链接
usingSystem.Web.SessionState;
抓取http网页的全部链接
usingSystem.Web.UI;
抓取http网页的全部链接
usingSystem.Web.UI.WebControls;
抓取http网页的全部链接
usingSystem.Web.UI.HtmlControls;
抓取http网页的全部链接
usingSystem.Net;
抓取http网页的全部链接
usingSystem.IO;
抓取http网页的全部链接
usingSystem.Collections;
抓取http网页的全部链接
usingSystem.Text.RegularExpressions;
抓取http网页的全部链接
抓取http网页的全部链接
namespacegetwebsite
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接抓取http网页的全部链接
/**////<summary>
抓取http网页的全部链接
///WebForm1的摘要说明。
抓取http网页的全部链接
///</summary>

抓取http网页的全部链接publicclassWebForm1:System.Web.UI.Page
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接
protectedSystem.Web.UI.WebControls.TextBoxTextBox1;
抓取http网页的全部链接
protectedSystem.Web.UI.WebControls.ButtonButton1;
抓取http网页的全部链接
protectedSystem.Web.UI.WebControls.TextBoxTextBox2;
抓取http网页的全部链接
protectedSystem.Web.UI.WebControls.RegularExpressionValidatorRegularExpressionValidator1;
抓取http网页的全部链接
抓取http网页的全部链接
privatevoidPage_Load(objectsender,System.EventArgse)
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接
if(!this.IsPostBack)
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接
抓取http网页的全部链接}

抓取http网页的全部链接
//在此处放置用户代码以初始化页面
抓取http网页的全部链接
}

抓取http网页的全部链接
抓取http网页的全部链接抓取http网页的全部链接
Web窗体设计器生成的代码#regionWeb窗体设计器生成的代码
抓取http网页的全部链接
overrideprotectedvoidOnInit(EventArgse)
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接
//
抓取http网页的全部链接
//CODEGEN:该调用是ASP.NETWeb窗体设计器所必需的。
抓取http网页的全部链接
//
抓取http网页的全部链接
InitializeComponent();
抓取http网页的全部链接
base.OnInit(e);
抓取http网页的全部链接}

抓取http网页的全部链接
抓取http网页的全部链接抓取http网页的全部链接
/**////<summary>
抓取http网页的全部链接
///设计器支持所需的方法-不要使用代码编辑器修改
抓取http网页的全部链接
///此方法的内容。
抓取http网页的全部链接
///</summary>

抓取http网页的全部链接privatevoidInitializeComponent()
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接
this.Button1.Click+=newSystem.EventHandler(this.Button1_Click);
抓取http网页的全部链接
this.Load+=newSystem.EventHandler(this.Page_Load);
抓取http网页的全部链接
抓取http网页的全部链接}

抓取http网页的全部链接
#endregion

抓取http网页的全部链接
抓取http网页的全部链接
privatevoidButton1_Click(objectsender,System.EventArgse)
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接
this.TextBox2.Text="";
抓取http网页的全部链接
stringweb_url=this.TextBox1.Text;
抓取http网页的全部链接
stringall_code="";
抓取http网页的全部链接HttpWebRequestall_codeRequest
=(HttpWebRequest)WebRequest.Create(web_url);
抓取http网页的全部链接WebResponseall_codeResponse
=all_codeRequest.GetResponse();
抓取http网页的全部链接StreamReadersr
=newStreamReader(all_codeResponse.GetResponseStream());
抓取http网页的全部链接all_code
=sr.ReadToEnd();
抓取http网页的全部链接sr.Close();
抓取http网页的全部链接ArrayListmy_list
=newArrayList();
抓取http网页的全部链接
stringp=@"http://([w-]+.)+[w-]+(/[w-./?%&=]*)?";
抓取http网页的全部链接Regexre
=newRegex(p,RegexOptions.IgnoreCase);
抓取http网页的全部链接MatchCollectionmc
=re.Matches(all_code);
抓取http网页的全部链接
抓取http网页的全部链接
for(inti=0;i<=mc.Count-1;i++)
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接
bool_foo=false;
抓取http网页的全部链接
stringname=mc[i].ToString();
抓取http网页的全部链接
foreach(stringlistinmy_list)
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接
if(name==list)
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接_foo
=true;
抓取http网页的全部链接
break;
抓取http网页的全部链接}

抓取http网页的全部链接}
//过滤
抓取http网页的全部链接

抓取http网页的全部链接
if(!_foo)
抓取http网页的全部链接抓取http网页的全部链接
...{
抓取http网页的全部链接TextBox2.Text
+=name+" ";
抓取http网页的全部链接}

抓取http网页的全部链接}

抓取http网页的全部链接
抓取http网页的全部链接
抓取http网页的全部链接}

抓取http网页的全部链接}

抓取http网页的全部链接}