HTTP状态码及代表什么? |
|
发起人:macroblue 回复数:0 浏览数:8939 最后更新:2012/2/10 10:09:50 by macroblue |
选择查看 | 帖子排序: |
macroblue 发表于 2012/2/10 10:09:50
|
HTTP状态码及代表什么? 细心的同学会发现,在本教程里,我们介绍概念的顺序是按该概念的重要性来的。 目标关键词、长尾关键词、链接锚文本的概念是最重要的,而且是同学们最不容易懂的,我们在本概念篇的最后会回到这几个概念上来。 其他的概念,是为着某一个具体的SEO操作而来。比如: Google分析,用来分析和统计网站访问情况; robots.txt,用来屏蔽死链接等。 今天,咱们要来讲一个新的为SEO操作目的而来的经典概念。 HTTP状态码:这是服务器和客户端之间交流信息的语言。 比如: 当客户端向服务器请求一个死链接时,服务器会返回“404”的信息。 “404”就是一个HTTP状态码,这个代码告诉客户端:“你请求的链接,我这边没有”。。 再举个例子,“200”这个HTTP状态码代表的是,“你的请求,已经成功发送”。 如果客户端向服务器发送一个链接,服务器返回“200”。那么就说明,服务器正常返回了客户端需要的信息。 HTTP状态码有什么用?和SEO有什么关系?。 因为网站日志往往会记录下HTTP状态码,所以通过查看网站日志里的HTTP状态码,我们可以清楚地看到网站服务器与客户端之间的信息交换情况。 这个客户端可以是用户浏览器,也可以是搜索引擎或其他爬取工具(如RSS)。 对于SEO来讲,HTTP状态码的最大意义就是,通过它们可以查看搜索引擎在你网站的爬取情况。 比如: baiduspider爬取的痕迹记录是“404”,就说明,百度蜘蛛刚才访问了一个死链接。 Googlebot爬取记录是“200”,就说明,Google机器人刚才正常抓取了一个页面。 一般在网站日志中,最常见的HTTP状态码就是200和404。 其他常见的HTTP状态码以及其代表的含义有: 成功2×× 成功处理了请求的状态码。 200 服务器已成功处理了请求并提供了请求的网页。 204 服务器成功处理了请求,但没有返回任何内容。 重定向3×× 每次请求中使用重定向不要超过 5 次。 301 请求的网页已永久移动到新位置。当URLs发生变化时,使用301代码。 搜索引擎索引中保存新的URL。 302 请求的网页临时移动到新位置。搜索引擎索引中保存原来的URL。 304 如果网页自请求者上次请求后没有更新,则用304代码告诉搜索引擎机器 人,可节省带宽和开销。 客户端错误4×× 表示请求可能出错,妨碍了服务器的处理。 400 服务器不理解请求的语法。 403 服务器拒绝请求。 404 服务器找不到请求的网页。服务器上不存在的网页经常会返回此代码。 410 请求的资源永久删除后,服务器返回此响应。该代码与 404(未找到)代码相似,但在资源以前存在而现在不存在的情况下,有时用来替代404 代码。如果资源已永久删除,应当使用 301 指定资源的新位置。 服务器错误5×× 表示服务器在处理请求时发生内部错误。这些错误可能是服务器本身的错误,而不是请求出错。 500 服务器遇到错误,无法完成请求。 503 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。 其他疑问: 1、怎么看网站日志? 通过Ftp (FTP 是File Transfer Protocol(文件传输协议)的英文简称,而中文简称为“文传协议”。用于Internet上的控制文件的双向传输。同时,它也是一个应用程序(Application)。用户可以通过它把自己的PC机与世界各地所有运行FTP协议的服务器相连,访问服务器上的大量程序和信息), 在根目录下可以看到一个包含log的文件夹,这就是网站日志。下载、解压,里面的txt文件内容就是日志记录。 但也有一些服务器或虚拟主机没有提供log文件,请与主机商联系,或自己开通服务器的记录日志功能。 2、网站日志中怎么看搜索引擎机器人? 搜索引擎机器人:百度的“代号”是baiduspider、Google是Googlebot、Yahoo是Slurp。 在日志中搜索baiduspider,看到的那行信息就是百度蜘蛛与服务器的沟通信息。 3、看到了200 0 0 代表什么?! 可以先简单记住,看到200就代表搜索引擎已经成功抓取了网页信息。 4、为什么“200”很多,但我的网站还没被收录,或收录很少? 如果和搜索引擎蜘蛛在一起的“200”很多,那收录是没问题的,但得等一次的更新期。除非被特殊处理,下次会展示很多出来。 5、怎么除了200之外的其他状态码很多? 请按以上的代码表对一下,然后分析为什么会出现这个情况。当然,如果只是个别则没事。 6、需要经常看吗? 只要你收录正常了,服务器没什么大问题,那一般没必要经常看。 7、推荐在线的HTTP状态码检测工具:http://www.seobox.org/getheader.htm 搜索引擎用来爬取网页内容的工具我们称之为搜索引擎机器人。 搜索引擎机器人每次来到要抓取的网站,都会先访问这个网站根目录下的一个文件(robots.txt),如果不存在该文件,则搜索引擎机器人默认这个网站允许其全部抓取。 |