当前位置:首页 > 网站SEO优化 > 正文内容

Robot.txt用法详解及robot.txt问题汇总

今天小编要分享的内容就是文件优化。做网站优化的人应该都知道Robots.txt吧,我们可以通过它直接与搜索引擎蜘蛛对话,告诉蜘蛛哪些内容可以抓取,哪些内容不能抓取。这和我们今天要说的文件优化相关。

Robot.txt用法详解及robot.txt问题汇总(图1)

一、站内优化  

Robot.txt用法详解及robot.txt问题汇总

(1)为什么设置Robots.txt?

在进行SEO操作的时候,我们需要告诉搜索引擎哪些页面重要哪些页面不重要,重要的页面让蜘蛛进行抓取,不重要的页面进行屏蔽可以减少网站服务器的负担。

(2)一些常见的问题和知识点

蜘蛛在发现一个网站的时候,是抓取网站的Robots.txt文件(当然官方上是这么说的,有时候也会出现不遵守的情况);

建议所有的网站都要设置Robots.txt文件,如果你认为网站上所有内容都是重要的,你可以建立一个空的robots.txt文件;

(3)在robots.txt文件中设置网站地图

你可以在robots.txt中添加网站的地图,告诉蜘蛛网站地图所在的地址。

(4)Robots.txt的顺序

在蜘蛛协议中,Disallow与Allow是有顺序的,这是一个非常重要的问题,如果设置错误可能会导致抓取错误。

引擎蜘蛛程序会根据个匹配成功的Allow或Disallow行确定是否访问某个URL,一个例子可以让你更清楚明白:

User-agent:*2.Allow:/seojc/bbs3.Disallow:/seojc/这个情况下,蜘蛛/seojc/bbs目录可以正常抓取,但/seojc/目录的文件无法抓取。通过这种方式可以允许蜘蛛访问特定目录中的部分url。

我们对调下位置观察一下。

User-agent:*2.Disallow:/根目录下的文件夹/3.Allow:/seojc/bbs/seojc/目录出现在行,禁止抓取目录下的所有文件,那么第二行的Allow就无效,因为行中已经禁止抓取seojc目录下的所有文件,而bbs目录正好位于seowhy目录下。因此匹配不成功。

(5)Robots.txt路径问题

在蜘蛛协议中,Allow和Disallow后面可以跟两种路径形式,即链接、相对链接。链接就是完整的URL形式,而相对链接只针对根目录。这是记住。

(6)斜杠问题

Disallow:/seojc表示禁止抓取seoic这个目录下的所有文件,如:seojc.1.Html、seojc/rmjc.php都不允许抓取;

Disallow:/seojc/表示禁止抓取seojc这个目录下的文件,即允许抓取seojc.1.html,但是不允许抓取seojc/rmjc.php。

相关文章

百度:网站质量与搜索效果不匹配 详解

百度:网站质量与搜索效果不匹配 详解

很多站长都用过百度资源平台的“反馈”功能,尤其是降权站经常会收到“网站质量与搜索效果不匹配”这条反馈的结果,针对于这一官方化的回答,如何理解呢?从字面上,我们把它剖析开:直译为:“网站的优化...

如何做到网站SEO关键词快速到达百度搜索引擎首页呢?

如何做到网站SEO关键词快速到达百度搜索引擎首页呢?

对于SEO工作人员来说,很多人一直在追求很快的关键词方法,很快就到达了百度搜索主页,然后误入歧途,步入了SEO欺诈之路。当然,如果你被迫在压力下工作,你也可以让关键词以正式的方式出现在主页上...

详细解释2022年百度优化问题

详细解释2022年百度优化问题

网站排名不动,排名又上又下。有些还没有排名。老网站的排名相对稳定。这是什么算法? SEO变得越来越困难。许多人已经失去了他们的优化排名。老站不需要移动,但...

盘点SEO效果评价的五个指标

盘点SEO效果评价的五个指标

本文将介绍评估SEO效果的五个指标,帮助您更加熟悉优化。SEO分析不仅仅是数据;它是数据和生态系统。将数据视为文字,将生态系统视为有助于理解这些文字的复合材料。了解如何解释SEO统计数据,以...

网站标题与内容满足用户需求,关键词排名不会太差

网站标题与内容满足用户需求,关键词排名不会太差

优化猩网站优化公司今天谈了主要影响关键词SEO排名的原因。早期的新百度排名算法倾向于对标题和内容描述的权重进行排名。如果标题和描述能够满足用户的需求,让百度实现你的价值,那么与你的内容相对应...

合理的蜘蛛程序开发有利于网站排名优化

合理的蜘蛛程序开发有利于网站排名优化

如果你有自己的站长经验,在内容创作的过程中,你会经常收录整理一些博客工具,这对SEO人员的日常工作起到了积极的作用。 例如:博客群发布、内容收录、关键词分...