利用搜索引擎进行资源搜集第一课时

这是一篇搜索入门的文章

本篇文章的环境是Win10,其他操作系统情况类似

如果使用的不是谷歌浏览器,建议使用谷歌浏览器(Chrome)

如果家里面的浏览器本身就是这个图标,那么恭喜你,你已经有了初步的搜索条件。如果不是这个图标,请按照下面的方法下载安装:
下载地址:https://www.google.cn/chrome/
在您当前浏览器的地址栏输入上面的网址,然后按下回车键就好了进入到官网,以IE浏览器为例:
利用搜索引擎进行资源搜集第一课时
然后点击 下载Chrome 按钮。

下载完成之后,直接安装即可。关于谷歌浏览器的配置,如何进行高效使用,涉及*的问题,请关注本公众号后续文章。

记住几个常见的搜索网址
安装完成之后,双击打开Chrome客户端。
也就是双击桌面上的
利用搜索引擎进行资源搜集第一课时
图标。
我们会发现Chrome异常简洁呢,甚至连一个默认网站都没给我们显示。那么此时我们该怎么做呢。
利用搜索引擎进行资源搜集第一课时
在浏览器的网址栏里分别输入下面的三个网址并回车
百度:https://www.baidu.com/
利用搜索引擎进行资源搜集第一课时
然后点击右上方的星号
利用搜索引擎进行资源搜集第一课时
就可以发现百度被保存到浏览器的书签里面了。
必应:https://cn.bing.com/
谷歌搜索:https://www.google.com/
在书签栏按照相同的方法将必应和谷歌加入到书签栏
利用搜索引擎进行资源搜集第一课时

必应是微软的一个搜索引擎,搜索结果以干净整洁著称,同时由于是国外公司的产品,必应搜索结果不会有广告,也不会在你搜索某物品之后,第二天会有商家打电话联系你是否需要该产品的困扰。

谷歌搜索引擎,由于GWF(*)的原因,普通情况下是访问不到的,解决方案有两个,第一是*,第二个是利用谷歌镜像站的原理。*我准备拿到进阶篇详细讨论,这里讲讲利用谷歌镜像站的解决办法。
首先,这是我目前知道的几个谷歌镜像站:

https://g.netis.io/
https://vip.kuaimen.bid/
https://ipv6.google-api.ac.cn/ 

如果要使用谷歌搜索引擎,那么就在浏览器中填入这些网址中的其中一个就好了。
谷歌搜索和必应搜索一样,不会讲用户的搜索历史泄漏给一些商家。

按照相同的方法,我们将这几个链接也分别放入到书签栏
利用搜索引擎进行资源搜集第一课时
你不需要区分哪一个是真正的谷歌搜索,只要点开不会出现浏览器一直处于
利用搜索引擎进行资源搜集第一课时
这样打转的情况就行。好了,此时你已经具有比较好的搜索环境了
使用谷歌搜索引擎或必应搜索引擎进行搜索
要使用浏览器,只需要点击我们刚刚在书签栏里建立的书签就可以到达相应的网址。
简单说一下上诉三个搜索引擎的区别,百度和必应都受国家防火墙的限制,进而搜索范围大打折扣,同时,百度搜索的结果是不准确的,具体包含广告,还有一些花钱提高搜索排名的商家。例如我们搜索 “java书籍”,百度出来的结果
利用搜索引擎进行资源搜集第一课时
可以看见,前面三个都是广告,不过,幸而有这个提示,所以大家使用百度搜索的时候,可以根据是否具有每一条搜索记录右下角是否有这么一个标记来判断是否是广告。
再来看看必应搜索的结果
利用搜索引擎进行资源搜集第一课时
也是有广告提示。不过实际上我们搜索这个东西并不是想看这些广告,所以上面两个搜索引擎都偏离了我们搜索的初衷。所以,还是再用谷歌浏览器试试
利用搜索引擎进行资源搜集第一课时
可以看到,这里给出的搜索结果就是各大网友的评价了。也就是别人的建议。这正是我们搜索想要的结果。
得出结论:搜索引擎,还是谷歌靠谱。但是谷歌有些问题,就是如果你对国外的一些信息比较敏感,不太喜欢的话,可以使用必应,必应大部分时间上是靠谱的。

我给出的建议是:国内搜索用必应,国外搜索用谷歌

对于要求不是很高的资源搜索,单单使用谷歌浏览器的功能就已经能满足日常的生活了。但是如果你需要经常搜集一系列资源,需要在某个网站里面单独搜索,可能还需要掌握下面的方法。
初步入门搜索语法
(1)、确定好你的某个搜索需求,然后判断这个搜索需求到底需要哪几个关键字儿。
技能需求:断句

例如:
我想要看看知乎里面的搞笑视频 关键字:搞笑视频、知乎
我想下载深入理解JVM虚拟机这本电子书 关键字:深入理解JVM虚拟机、pdf、下载
(2)、用空格或者点号分隔关键词。
技能需求:需要判断关键词的重要性,将重要的放在前面。

如果不确定顺序可以多试几次顺序,看何种顺序适合你的想法。这里我稍微说一下搜索流程,搜索引擎应该是按照关键词逐一搜索缩小范围的。最前面的搜索集合为U,现在有abc三个关键词,如果以 a b c这样的顺序排列关键词,那么搜索引擎先搜索a得到的结果为 Ua然后再在Ua里面找b和c,按照数学原理,最终的结果应该等于 Ua、Ub、Uc三个集合的交集,与三者顺序没有关系。但由于互联网集合太大和给出的关键词不一定准确,导致这三个结果集特别庞大,搜索引擎无法全部过滤,进而只能通过关键词优先级的方式进行处理。越往前优先级越高。

有了上面两个方法,大部分情况下就已经可以搜索出来想要的结果了。这里再补充一点基础的略微跟编程有点关系的方法。
(3)、使用谷歌高级搜索(谷歌页面的方式)
方法:在镜像站的url后面加上: /advanced_search 然后回车
例如:
访问:https://ipv6.google-api.ac.cn/advanced_search
利用搜索引擎进行资源搜集第一课时
大家只要按照要求填写搜索关键词就好。

(4)、使用初级语法
site:+网址+关键词列表
注意,网址中尽量缩小范围,但是如果你不确定到底是该域名下的哪一个网址时,建议使用一级域名。下面举例子讲讲什么是一级域名

https://www.baidu.com/   一级域名为:baidu.com
https://www.cqu.edt.cn/   一级域名为:cqu.edu.cn

大家可以根据上面的方法进行抽象
例子:
利用搜索引擎进行资源搜集第一课时
你会发现百度都变得可用了。但是有时候,百度很多东西搜不出来,来看看下面的关键词
利用搜索引擎进行资源搜集第一课时

来看看google的结果
利用搜索引擎进行资源搜集第一课时
注意,我这里是随便搜索的一个东西,没有任何特殊意义

Intitle +关键词
表示搜索关键词位于title中的内容,那么大家知道title在哪嘛?
利用搜索引擎进行资源搜集第一课时
这些网页的标签里面的内容就是title。
例子:
利用搜索引擎进行资源搜集第一课时
然后我点击第一个
利用搜索引擎进行资源搜集第一课时
就可以搜出来了。
类似的,还有 Inurl(关键词在url中)+关键词,intext+关键词(在正文中),这里我就不一一介绍了。

进阶篇:谷歌高级语法深入探索、利用谷歌进行*、利用chrome浏览器分析网站接口的方法以及简单爬虫分析