爬虫基础--------一个完整的网络请求过程
(学习慕课网bobby老师的课程从零起步 系统入门Python爬虫工程师时做的笔记,有兴趣的同学可以去慕课网观看视频。)
平时用的比较多的是浏览器,比如浏览器去请求一个网站,然后网站返回数据,这个过程在我们使用时看起来是非常普遍的,这里来简单介绍一下它的具体流程。
发起一个慕课网首页的请求(在浏览输入imooc.com);
浏览器首先会查询DNS服务器(查询域名imooc.com的IP地址);
查询到后,DNS服务器会将IP地址返回给浏览器;
浏览器拿到IP地址后,先与慕课网的web服务器(通过协议)建立TCP连接;
浏览器就可以向慕课网的web服务器发起http请求;
web服务器生成好再向浏览器返回http;
浏览器拿到http后就会进行一系列渲染,展示等操作。