如果我一天把一个词百度搜索一万遍,能否以一己之力把它变成热词?
各位在评论前请先看题目:
我一天把一个词百度搜索一万遍
我在几天之内上万次的搜索一个网站
我数以万计地反复搜索一个词
--------------二次更新分割线--------------------
V2.0更新:
1.使用了requests库。
2.可自定义搜索词。
3.增加了浏览器标识信息(UA),更贴合问题。
更新的源码在末尾。
—————更新分割线,以下原回答—————
不能。
但因为实践是检验真理的唯一标准。
首先,需要了解百度搜索是怎么运行的。
先百度一个词:
URL中出现了"zhihu".
如果我们再百度中文呢?
原来“zhihu”的位置变成了“%E7%9F%A5%E4%B9%8E”。
其实这个“%E7%9F%A5%E4%B9%8E”,就是”知乎“的urlencode编码。
用在线转换工具就可以转出来:
了解了原理后,就可以开始写啦。
然后我拿出了这个:
不好意思拿错了,这个才是:
先写一个访问网页的脚本:
import urllib.request
with urllib.request.urlopen('http://www.baidu.com/') as response:
html = response.read()
print(html)
访问后会返回www.baidu.con的内容:
访问网页解决了,我们再给他加个死循环,让它一直访问:
import urllib.request
while True:
with urllib.request.urlopen('http://www.baidu.com/') as response:
html = response.read()
print(html)
如果嫌他一直闪太晃眼可以把print(html)去掉。
或者改成计数器:
import urllib.request
a = 0
while True:
a = a + 1
with urllib.request.urlopen('http://www.baidu.com/') as response:
html = response.read()
print(a)
最后就是更换URL:
import urllib.request
a = 0
while True:
a = a + 1
with urllib.request.urlopen('https://www.baidu.com/s?tn=80035161_2_dg&wd=%E7%9F%A5%E4%B9%8E
') as response:
html = response.read()
print(a)
运行:
大功告成!
接下来就是找人一起运行这个脚本啦。
------------V2.0更新-----------------
v2.0源码更新:
import requests
st = input("输入搜索词:")
fr = 0
headers = {'User-Agent':'User-Agent,Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763'}
while True:
fr = fr + 1
response = requests.get('http://www.baidu.com/s?tn=80035161_2_dg&wd=%s'%(st),headers=headers)
if str(response.status_code) == '200':
print(fr)
else:
print("Error")
源码解析有空再写(感觉这是个坑)。
知乎管理员提醒您:看文千万条,点赞第一条。光看不点赞,答主两行泪。
点完赞可以去看看我另一个沙雕回答:
作为一个学生,电脑课一般会被教室机控制,怎么摆脱控制?www.zhihu.com
赞同 7.6K256 条评论
分享
收藏感谢
收起
营销路上一学徒
522 人赞同了该回答
第一个问题:一天的话,不能。
第二个问题:自己搜索,不能。
第三个问题:没什么影响。
第一个问题:一天的话,不能。
如果题主说的热词,是上了热搜榜或者飙升榜的。
这样的词
- 不但是搜索量的爆发式增长,
- 而且是发生在大范围之内的,
- 并且,相关网页数量爆发式增长。
单纯依靠搜索,而没有相关内容,上不了热搜。
如果题主说的热词,是百度指数很高的词。
那么需要持续的搜索。一天,不行。
昙花一现,不能算热词,只能算长尾词。
比如下面这张图,是之前知乎一个回答的:
如果这个指数不是刷的,那这个词只能算长尾词。
所以题主想刷成热词,得持续的搜索。
自己一台电脑,不行。
很可能你搜不了几万次,很快就会遇到输验证码的情况。
如果通过其他手段去产生大量搜索,并且持续进行,有可能。
不然一些明星、公司的高指数怎么来的。
第二个问题:自己搜索,不能。
自己搜,会遇到验证码等防范机制。
如果通过其他手段:
- 单纯的几万次搜索,不点击,没意义。
- 如果搜索几万次,并进行点击等行为,需要考虑百度的反作弊系统。
如果暂时没被反作弊系统监控到,那么在你搜索的那个词上,会获得短时间的排名上升。
被反作弊监控到,排名就下降。
不过反作弊系统总有漏洞,或者是懒得搭理你,所以很多人一直在做类似的事。
比如刷下拉
有兴趣可以参考下我之前的文章:小曹同学:SEM M 8 note:通过搜索分析需求的弊端
想要维持排名,需要自然流量的点击和留存的配合。
点击率低、留不住,排名最终也会下降。
这里的自然流量不单单是1个词或者几个词,要从行业角度考虑。
第三个问题:没什么影响。
自己搜,会遇到百度的防范机制。
如果你真的通过其他方式进行了几万次搜索……
也没什么影响。
不是每次搜索,都经过服务器计算再返回结果的。
日常搜索的大多数词,其搜索结果,都在搜索引擎的缓存里面。
对于百度来说,相当于我们只是请求了一个静态网页,不需要搜索引擎的服务器去检索、排序。
一个百度搜索结果页不到250K,加上各种文件(这些还都会存在浏览器缓存里),800多K,算1M吧。
10万次搜索,也就是10万M,还不到100G。
几秒搜索完的话,当做一次DDoS攻击吧。
百度云加速就能轻松应对。
如果百度搜索用百度云加速的服务,怎么着也得是旗舰版定制下吧。
如果搜索的内容不在缓存里面,这时百度才会检索索引库、链接库,进行排序计算,并返回一个搜索结果。
如果搜索的次数多,这个结果也会进入缓存。回到上面那种情况。
如果不是题主自己搜索,而是很多人、大范围,或者通过手段去进行大量搜索、点击,那么这些行为会影响排序。
不过也只是暂时影响排序而已,对于搜索引擎没有任何影响。
因为题主做的,每时每刻都在发生。商业化的搜索引擎都习以为常了。