或者

百度算法大揭秘与最新算法调整

作者:wangj 浏览:1586 发布时间:2016-05-18
编辑 分享 评论 0

百度一直牢牢占据着国内搜索引擎霸主的位置。弄懂了百度算法,就意味着Hold住了网站排名和流量。曾经多少年来,无数SEOer为研究百度的算法呕心沥血,对于弄清百度排名算法成为了一代又一代站长的最高目标。

首先申明下,刘兴时今天分享的内容要感谢圈内朋友赵一鸣、子墨柔情等人的大力支持。这一章节的内容比较长,刘兴时这边根据各方面数据整理的百度搜索引擎算法有260项,光整理此篇文章都花费了我半个月时间,这也印证了Swowhy好长时间都见不到刘兴时的一个原因了。

百度算法从未对外公布过,以下算法心得均是刘兴时8年来总结推测和资深站长提供。打算长期从事SEO工作的新手,强烈建议收藏哦,希望对大伙儿在操作SEO过程中有所帮助!哈哈,废话不多说了,直接进入话题!

SEO总结:百度算法大揭秘与最新算法调整

百度算法规则

刘兴时曾几何时,从来不相信百度的算法有那样的神奇,但是百度确针对这一系列的算法做出了公告与K站降权的举动,不得不让我仔细分析百度算法的原理,以下几个算法仅为刘兴时个人推测。

百度绿萝算法:我一直不相信百度绿萝算法竟然可以算出来你的链接是否购买的,但是实际百度却做到了,其中主要原理还是根据一个网站对另一个网站的链接判断,是否有反向链接、链接个数来进行判断。

百度石榴算法:石榴算法主要打击的对象为低质量页面,其中百度蜘蛛主要是根据网站html代码来抓取的,并且搜索引擎根据文章的标签(包含排版)、重复读来进行判断网站的质量。

百度星火计划:星火计划的原计划是为了打击抄袭者,其星火计划的原理非常简单了,也就是判断重复读来决定网站是否抄袭,同时百度蜘蛛也肯定了自己的抓取程序,目前正在往每一个网站时刻爬取靠拢。

百度瑞丽算法:2015年元旦,百度内部相关程序出现了一些故障,导致国内大量的CN和CC域名站点被K,而不少人预测这是瑞丽算法上线的结果。不过刘兴时从种种迹象推测,瑞丽算法应该是一种误传。

收录规则

要想有排名的前提下是收录,要向收录的前提下是有内容,所以很多网站内容太单一是很难被收录,但也有网站明显有内容就是不收录的,我是这样理解收录的。

抓取:百度收录一个网站或页面的前提是网站被百度抓取过,也就是百度的机器来过你的站点,来你站点的前提是有一个入口,百度的入口有三个,第一自己提交、第二SEO外链、第三浏览器。浏览器大家可能不是很明白,当你的网站刚刚建立后,没有人知道你的建站建立好了,自然百度也不会知道,唯一知道的就是你自己了,如果你使用百度浏览器打开你的网站,这也就意味着,百度浏览器已经知道了这个站点的存在,数据也就交给了百度搜索引擎,从而达到了抓取的效果。光抓取还是不够的,不一定所有的内容都会被百度收录,所以他们收录也是要判断内容标准。

识别:抓取了一个页面,肯定是有内容的,如果说没有内容是很难被收录的,什么是没有内容的页面呢,比如登录注册页面,这类页面是属于有内容没有意义的页面。直接会被列入到空白页面,想这类页面,我们的网站还是非常多的,比如:关于我们、联系我们之类的页面。

所以页面肯定得有内容,并且是可识别的内容,什么叫可识别的内容,就是文字内容,百度搜索引擎是机器在识别,当遇到视频、图片、flash的时候,他们不知道视频、图片里面展现的内容是什么,所以无法识别,所以前期最好还是以文字为主。

释放:最终才考虑到释放出来,如果释放出来后,这个时候你可以通过百度搜索你的URL,释放你的页面也是需要有条件的。

首先会判断你的页面站外推荐很多,这也就意味着这个页面是高质量的页面才会被站外推荐,容易被收录,其次是被站内推荐,这也意味着是这个页面是高质量页面才会被站内推荐。说白了,要向释放出来的内容,绝对是高质量的内容,除非发生了下面这种情况。

最容易被收录的内容绝对是互联网新闻源最多的内容,说白了就是抄袭者很多的内容是最容易被收录的。这个时候太多人不容易理解了,抄袭越多越容易被收录?

新闻内容是具有时效性的,当一篇新闻发布以后,马上就有很多媒体转载你的内容,而百度机器识别出来,很多新闻源有同样的内容,也就被列入了新闻的话题页面,从而这方面的内容收录也就非常简单了,不会等一天或几天后才收录,如果过几天才收录,这个新闻内容已经过时了,自然也就影响了百度的体验。

排名规则

参与排名的规则并没有想象中那么复杂,听到这位大哥分析了以后,自认为有一定的价值,其实无非就几个方面解决排名问题。

得分规则:得分规则是根据一个网站的总体信誉度,比如网站的原创度、网站的停留时间、网站的跳出率、网站的打开速度、网站图片的处理、网站代码的优化等综合判断,总体被称为得分规则。

点击规则:当你网站信誉度达到一个基础标准后,你网站会出现一些非常长尾的关键词,可能关键词排名并没有在首页,这个时候就是根据点击率的规则来计算排名的。如下图所示,当一个关键词展现量和点击率达到一个比例后,你的排名就会上前一个等级。而这个比例是根据用户的点击来计算的,并非百度定义的,比如搜索“翻墙”这个关键词,排名第二的网页比第一的点击率还高,自然排名第二的页面会会给他排名第一。

链接规则:当你的一篇文章被站外链接过多推荐,这意味着这篇文章价值非常大,不然对方不会推荐,另外也被站内推荐多次,这也意味着这篇文章价值非常大,所以链接的规则就非常简单的,但是由于百度绿萝算法一直在打击垃圾外链,所以在链接上,最好还是自然链接比较安全。

SEO总结:百度算法大揭秘与最新算法调整

算法规则(附部分)

  1、网站服务器的稳定性

2、网站服务器的安全性

网站服务器的安全是十分重要的,尤其对金融、旅游、移民等高利润行业站点。

3、同IP下的网站越少越好

4、同IP下的网站无大量被K

5、同IP下的网站无大量被降权

6、转移服务器会影响网站排名

网站搬家、网站转移服务器会网站排名的,这里刘兴时推荐采用网站流量点击保护可以很大程度避免排名的下滑。

7、域名包含关键词(拼音、英文)

就比如我做快速消费品网SEO排名,推荐域名中包含有seo等关键词。

8、域名年龄越老越有排名优势

9、域名主题的转换直接影响排名

10、备案对网站排名稳定性的重要

11、最好采用DIV+CSS布局

12、表格布局避免过多嵌套

13、网页编码对网站的影响

14、整站生成静态HTML

静态化肯定是特别利于优化的,但是很多站长的空间没有那么大,这里刘兴时推荐可以采用伪静态的优化手法。

15、动态URL的优化劣势

16、目录的层次不要太深

17、目录名称的优化

18、网页URL不要太长

19、网站内容的原创性

20、避免大量内容重复

21、避免大量采集内容填充

22、避免大量页面内容相似度太高

23、网站内容不要出现违法字眼

24、内容越丰富越有利于排名

25、内容被收录的数量越多越好

26、页面大小(建议小于100K)

页面内容在满足用户需求的同时,尽量体积小些,比如百度的首页大小才4K。

27、页面避免出现太多图片

28、网站sitemap时时更新与提交

29、新页面产生的速率

30、网站Meta的优化设计

31、Deion的优化设计

32、Keywords的优化设计

33、避免太多无关的关键词

34、网页PR值对排名的影响

35、核心关键词的选取

对网站核心关键词一定要定位准确,快速消费品网(www.ksxfp.org)和fmcg虽然意思一样,但是优化的时候一定要有个针对性。比如:快速消费品发展前景,快速消费品销售管理,又能给用户最为顺畅方便记忆的标题。

36、扩展关键词的选取

37、长尾关键词的选择

38、关键词在网站TITLE上的使用

最好的关键词在title显示是一句通顺的语句,既适合搜索引擎的匹配抓取,又适合用户的浏览点击。

39、保持网页Title的唯一性

40、标题设计不要过长

这里主要是针对快照索引字节,对手机站的标题就需要更少点,毕竟现在移动端站优化也是主流方向,对移动站标题的设计就需要更少字节。

41、标题不要堆砌关键词

42、标题的分词描写规则

43、标题描写结合长尾关键词

44、每个标题最好突出1-2个关键词

45、关键词在Meta Deion中的使用

可参考刘兴时的SEO博客的deion写法

46、关键词在Meta Keywords中的使用

47、关键词在H1、H2、H3标签中的使用

48、一个页面尽量只使用一个H1

很多人都在好奇为什么我的快速消费品网一直排名那么好,其实大家可以仔细点开我的每一个内页,我的每一个内页的标题都是在 H1中包裹的。

49、关键词在页面URL中的使用

50、在url中使用"-"连接关键词,优化效果“_”等特殊符号。

51、关键词与页面内容的相关性

52、关键词的加粗优化

53、关键词的斜体优化

54、关键词的下划线优化

55、关键词的跑马灯优化

56、关键词字体大小

57、图片的关键词优化 alt标签

58、关键词是否突出

59、关键词的密度6%左右

其实网站关键词密度这个事在网站优化过程中并没有那么重要,刘兴时优化网站的时候是不会刻意控制关键词密度的,除非碰到一些竞争超级大的行

词条统计

  • 浏览次数:1586
  • 编辑次数:0次历史版本
  • 最近更新:2016-05-18
  • 创建者:wangj
  • 相关词条

    相关问答

    相关百科

    相关资讯