当前位置:首页 > 网站SEO优化 > 正文内容

Robot.txt用法详解及robot.txt问题汇总

Mrzhu2个月前 (09-11)网站SEO优化27

今天小编要分享的内容就是文件优化。做网站优化的人应该都知道Robots.txt吧,我们可以通过它直接与搜索引擎蜘蛛对话,告诉蜘蛛哪些内容可以抓取,哪些内容不能抓取。这和我们今天要说的文件优化相关。

Robot.txt用法详解及robot.txt问题汇总(图1)

一、站内优化  

Robot.txt用法详解及robot.txt问题汇总

(1)为什么设置Robots.txt?

在进行SEO操作的时候,我们需要告诉搜索引擎哪些页面重要哪些页面不重要,重要的页面让蜘蛛进行抓取,不重要的页面进行屏蔽可以减少网站服务器的负担。

(2)一些常见的问题和知识点

蜘蛛在发现一个网站的时候,是抓取网站的Robots.txt文件(当然官方上是这么说的,有时候也会出现不遵守的情况);

建议所有的网站都要设置Robots.txt文件,如果你认为网站上所有内容都是重要的,你可以建立一个空的robots.txt文件;

(3)在robots.txt文件中设置网站地图

你可以在robots.txt中添加网站的地图,告诉蜘蛛网站地图所在的地址。

(4)Robots.txt的顺序

在蜘蛛协议中,Disallow与Allow是有顺序的,这是一个非常重要的问题,如果设置错误可能会导致抓取错误。

引擎蜘蛛程序会根据个匹配成功的Allow或Disallow行确定是否访问某个URL,一个例子可以让你更清楚明白:

User-agent:*2.Allow:/seojc/bbs3.Disallow:/seojc/这个情况下,蜘蛛/seojc/bbs目录可以正常抓取,但/seojc/目录的文件无法抓取。通过这种方式可以允许蜘蛛访问特定目录中的部分url。

我们对调下位置观察一下。

User-agent:*2.Disallow:/根目录下的文件夹/3.Allow:/seojc/bbs/seojc/目录出现在行,禁止抓取目录下的所有文件,那么第二行的Allow就无效,因为行中已经禁止抓取seojc目录下的所有文件,而bbs目录正好位于seowhy目录下。因此匹配不成功。

(5)Robots.txt路径问题

在蜘蛛协议中,Allow和Disallow后面可以跟两种路径形式,即链接、相对链接。链接就是完整的URL形式,而相对链接只针对根目录。这是记住。

(6)斜杠问题

Disallow:/seojc表示禁止抓取seoic这个目录下的所有文件,如:seojc.1.Html、seojc/rmjc.php都不允许抓取;

Disallow:/seojc/表示禁止抓取seojc这个目录下的文件,即允许抓取seojc.1.html,但是不允许抓取seojc/rmjc.php。

相关文章

百度SEO:搜索基础展现解读

百度SEO:搜索基础展现解读

一、什么是搜索基础展现?用户在百度搜索引擎中根据自身的搜索需求输入关键词,从得到的搜索结果中,筛选出符合需求的内容,产生点击行为。这个过程中,【搜索展现】传递给用户的信息,会影响用户的决策和...

SEO优化公司从SEO优化角度诊断网站是否需要做推广?

SEO优化公司从SEO优化角度诊断网站是否需要做推广?

在网站推广中,个性化搜索对搜索引擎有很高的要求。目前,主流的搜索引擎技术还不完善,因此并不普及,但它必将成为未来搜索技术的一个发展方向。对于依赖网站推广搜索引擎的SEO行业来说,有...

为什么网站优化需要做排名监控?

为什么网站优化需要做排名监控?

在SEO推广中,SEO人员必须了解关键字排名的位置。在SEO优化中,合理跟踪关键字排名非常重要。让我们看看网站排名监控的作用是什么?  根据以往关键词分析的经验,我们认为常见关键词...

网站SEO运营成本与关键词波动原因分析

网站SEO运营成本与关键词波动原因分析

SEO我相信大家都知道,但是如何应用到客户服务中,而营销的成本到底应该是多少呢?这可能与每个SEO服务公司的运营成本有关,因此我们将以一个小公司为例来计算优化一个关键字的成本。小型优化公司人...

总结SEO优化关键步骤与推广流程

总结SEO优化关键步骤与推广流程

SEO一般分为站外优化和站内优化。站外优化主要是外部链接和品牌曝光。相对而言,站点优化做了更多的工作。SEO站点优化方法有哪些?今天会给大家讲解,希望对新手有所帮助。...

遇到网站内容稀缺,如何做网站排名?

遇到网站内容稀缺,如何做网站排名?

随着互联网时代的不断发展,用户越来越依赖搜索引擎。当用户遇到问题时,他们会使用搜索引擎搜索答案。因此,搜索引擎已经积累了大量的用户群。为了获得更好的宣传效果,企业需要在搜索引擎中进行推广。在...