或者

浅谈304状态码解决办法

作者:dengying 浏览:2350 发布时间:2015-06-10
编辑 分享 评论 0

  

    一般以为:搜索引擎爬虫会更青睐内容原创且更新频繁的网站,并通过特定时间内对网站抓取返回的状态码来调整对该网站的抓取频率。若网站在相称一定时间内一直处于[304:没有变化]状态,那么引擎爬虫可能会降低今后对网站的抓取次数。反之,若网站更新变化的频率非常之快,每次抓取都能获取新内容,那么日积月累,爬虫的回访率天然而然也会进步。

  不管是抓取少仍是304,这都是一种现象,而不是题目泛起的原因。假设网站返回的都是200,就能达到晋升网站排名并带来流量的目的么?比拟之下更应该思索产生304的原因是什么?调整304对网站能够有什么样的效果?不能忽视整体的目标而过分夸大过程的细节,单纯为了200而去解决304。

  一、304状态是如何产生的?

  服务器为了进步网站访问速度,对之前访问的部门页面制定缓存机制,当客户端在此对这些页面进行哀求,服务器会根据缓存内容来判定页面与之前是否相同,若相同就直接返回304,此时客户端会直接调用缓存内容,不必重新进行二次下载,可以说304从某种角度起到了减少服务器带宽并进步蜘蛛爬行效率的作用。

  二、304状态产生的原因?

  1.页面更新周期过长或基本不更新

  2.纯静态页面或强制天生静态html

  三、304状态如何处理?

  1.先对产生304页面进行细分,到底是哪类页面返回了304?这些页面是否应该返回304?

  2.这些页面天生的方式是怎样的?是否有更新机制?更新机制是否符合蜘蛛对网站的抓取频率?

  3.页面更新区域的位置布置是否公道?是否位于该页面主要内容的承载区域内?

  有不少SEOer也对此情况做了如下分析:

  304状态码泛起过多会造成以下题目:

  1.网站快照更新停滞

  2.收录页面减少

  3.流量、权重下降

  四、那么如何减少304返回码呢?

  首先内容更新方面要迎合搜索引擎蜘蛛。分析日志,把蜘蛛到访的时间记实下来,可大致推算出蜘蛛到访的频率,然后以此为依据,更新文章:最好是原创+转载,不能纯采集。转载也需要最新最好的优质资源。让蜘蛛这个点过来能有吃的,从而返回更多200正常码。

  其次,最好有互动版块。现在大网站基本已经都做了这方面工作,好比评论、留言等,大网站更新起来变化可能会很小,但是有了这些互动,用户会在上面发些内容,网站会有良多新的内容。


词条统计

  • 浏览次数:2350
  • 编辑次数:0次历史版本
  • 最近更新:2015-06-10
  • 创建者:dengying
  • 相关词条

    相关问答

    相关百科

    相关资讯