我可以通过编程方式阻止人们从我的网站获取内容吗?

我可以通过编程方式阻止人们从我的网站获取内容吗?

问题描述:

假设我有一个WordPress博客文章站点。我发现有人在那里复制我网站每一页的内容,并将其粘贴到他自己的网站上。我相信他不会手动做,因为数量巨大。我尝试复制他所做的,并且我发现使用curl和Dom分析(给出我知道有用文本所在的类名)的方法来做同样的事情实际上很容易。我可以通过编程方式阻止人们从我的网站获取内容吗?

我可以有任何方法来阻止它,或者至少使它更难以在将来做到吗?谢谢!

+0

尽管降低了效果,但我不认为这至少会增加难度。我可以卷曲我的网站,但对于中国的一些小说网站,我只能通过卷曲获得垃圾。他们没有使用JavaScript来解读乱码测试,就像我在浏览器中禁用JS一样,我可以毫无问题地查看网站的正常版本。我会试着看看他们是如何实现这一点的,如果我找到答案可以发表一个答案。 – user2335065

请记住,无论您向网站的观看者公开的任何信息是总是以编程方式检索。所有网络浏览器连接到Web服务器并使用HTTP请求信息。

你可以尝试阻止他使用的任何软件的用户代理(如果它提供了一个用户代理),但这可能是徒劳的。您的博客帖子向公众公开,因为您打算让他们阅读它们。一旦这些信息在客户端,您就无法进一步控制它。

+0

阻止IP地址可能更有效。更改用户代理很可能是微不足道的,假设它尚未使用通用代理。 –

+0

就像是阻止IP地址一样。两者都是针对长期问题的短期措施。 –

如果废除您的网站的人没有通过cURL进行多少配置,那么您可以使用某些用户代理字符串解析来检测cURL用户并抛出404或做任何其他类型的处理。 (更多信息:http://www.useragentstring.com/pages/curl/

请记住,cURL允许您制作请求,并允许您欺骗用户代理和Web请求的大多数其他详细信息,以使其与常规Web通信无法区分。

除此之外,你可以阻止特定的人的IP地址,但这是一个非常具体的修复,并没有解决任何人丢弃内容的广泛关注。