当前位置:首页 > 网站SEO优化 > 正文内容

如何排除无关蜘蛛爬虫干扰高质搜索引擎蜘蛛抓取网站?

在搜索引擎优化过程中,你是否遇到过这样的问题:服务器访问的CPU利用率接近,页面加载速度特别慢,似乎受到了DDoS的攻击。

如何排除无关蜘蛛爬虫干扰高质搜索引擎蜘蛛抓取网站?(图1)

经过回顾,我发现原来的目标网站经常被大量无关的“爬虫”抓走,这对一个小网站来说可能是一场灾难。

因此,在进行网站优化时,我们需要有选择地引导特定的蜘蛛。

根据以往SEO经验分享,小编将通过以下几点来阐述:

一、搜索引擎爬虫

对于国内的小伙伴来说,我们都知道在SEO的过程中,我们面对的常见的爬虫就是搜索引擎的爬虫,比如百度蜘蛛,还有各种搜索引擎的蜘蛛,比如:

①360Spider、SogouSpider、Bytespider

②Googlebot、Bingbot、Slurp、Teoma、iauarchiver、twiceler、MSNBot

③其他爬行动物

如果不故意配置robots.txt文件,理论上,可以对目标页进行爬网和爬网。然而,对于一些中小型网站来说,它偶尔会浪费自己的服务器资源。

此时,我们需要做出有选择性、合理的指导,特别是一些尴尬的问题,比如:你希望谷歌减少对网站的爬网,但不能完全屏蔽它,你可能需要一些提示,比如:对于具体的爬网访问,反馈不同的文章列表:

①控制更新频率表

②反馈重复性强,内容农场页面

③善意的“蜘蛛陷阱”,如flash

④如何调整对方的SEO管理平台,获取评论并进行适当调整

虽然这样的策略很可能会对页面声誉造成损害,但我可以想出一个相对“有效”的方法,合理控制那些不想频繁爬行但需要不断爬行的蜘蛛的爬行。

二、链接分析爬虫  

从目前来看,一个SEO外部链分析管理工具需要每天花费大量的服务器资源来抓取和检测每个网站的页面链接。

对于一些资源密集型的网站来说,每天爬行数千次是可能的,这种爬行动物很常见。

如果你不想让自己的网站参与其中,简单的策略是在robots协议中完全关闭此类爬虫程序。

三、内容收集爬网程序

但当我们面对一些恶意的内容收集爬虫时,就相对尴尬了。另一方经常采用“看不见”的状态,比如:模拟一个出名搜索引擎蜘蛛的名字。

要解决这个问题,只能手工判断对方庐山的真伪,比如:使用IPPAn解析命令判断真伪。

①Linux平台:主机IP

②Windows平台:nslookupip

从而确定对方的解析地址是否为相应的搜索引擎域名。

四、蜘蛛池爬行动物  

目前,市面上有很多人做百度蜘蛛池,其主要目的是协助更多的页面做百度快速收录,但由于一些随意下载蜘蛛池的程序设计不规范。

由于没有对不同的蜘蛛进行合理的抓取和限制,服务器资源经常被服务提供商占用,很容易被关闭。

如果你试图使用这个策略来提高你的页面包含率,那么你可能需要更多的关注。

相关文章

百度SEO:主动访问用户数对站点评级的作用

百度SEO:主动访问用户数对站点评级的作用

主动访问用户也可以称为忠诚用户、自有用户,搜索引擎可以通过多种渠道和手段定位网站的主动访问用户。主动访问用户包括但不限:需要答案、需要解决问题时,自然而然想到某网站的用户;有内容要分享、有委...

新手做SEO最简单的方法,保稳定 靠谱!

新手做SEO最简单的方法,保稳定 靠谱!

说实话,很久没有写这这种最基础类型的东西了,但是仍旧有很多新手需要这方面正确的引导,所以这篇文章来了!这篇文章,对于老牌站长来讲,没有特别深入的东西,但是绝对适合新手SEO来学习!不管你是初...

独立站SEO优化怎么办?六大seo技巧助力独立站优化推广

独立站SEO优化怎么办?六大seo技巧助力独立站优化推广

独立网站将成为焦点,品牌出海已成为不可逆转的趋势。我们怎样才能做好一个独立的电台?独立站SEO优化怎么办?本文介绍了SEO优化的六大技巧,值得一试。 标签...

从这七点判断一个网站是否符合用户与搜索需求

从这七点判断一个网站是否符合用户与搜索需求

随着互联网的发展,越来越多的企业关注网站的建设和优化。我们应该从哪些方面评估你的网站优化是否优秀?请参见以下方面:  1、网站定位清晰  我们应该对网站有一个明确的定位,...

企业只有先解决百度蜘蛛抓取频次才能做好关键词排名

企业只有先解决百度蜘蛛抓取频次才能做好关键词排名

随着互联网行业的发展,很多企业现在开始做网络SEO优化。许多网站没有被收录或被收录得更少,特别是对于新网站。搜索引擎包含网站的先决条件是百度蜘蛛的捕获。企业网站优化如何提高蜘蛛的捕获频率?一...

从四大方面分析企业网站seo优化重点与难点

从四大方面分析企业网站seo优化重点与难点

企业网站SEO分析重点一:网站结构调整 网站结构的调整是必要的,所以作为SEO人员,尽量了解Html和编程知识,否则做SEO会很困难,可以说每一步都很难。...