或者

关于搜索引擎优化你了解多少?

作者:冷鱼 浏览:165 发布时间:2018-05-24
分享 评论 0

搜索引擎优化(英语:search engine optimization,缩写为SEO),是一种通过了解搜索引擎的运作规则来调整网站,以及提高目的网站在有关搜索引擎内排名的方式。由于不少研究发现,搜索引擎的用户往往只会留意搜索结果最前面的几个条目,所以不少网站都希望通过各种形式来影响搜索引擎的排序,让自己的网站可以有优秀的搜索排名。当中尤以各种依靠广告维生的网站为甚。


所谓“针对搜索引擎作最优化的处理”,是指为了要让网站更容易被搜索引擎接受。搜索引擎会将网站彼此间的内容做一些相关性的数据比对,然后再由浏览器将这些内容以最快速且接近最完整的方式,呈现给搜索者。搜索引擎优化就是通过搜索引擎的规则进行优化,为用户打造更好的用户体验,最终的目的就是做好用户体验。

对于任何一个网站来说,要想在网站推广中获取成功,搜索引擎优化都是至为关键的一项任务。同时,随着搜索引擎不断变换它们的搜索排名算法规则,每次算法上的改变都会让一些排名很好的网站在一夜之间名落孙山,而失去排名的直接后果就是失去了网站固有的可观访问流量。所以每次搜索引擎算演法的改变都会在网站之中引起不小的骚动和焦虑。可以说,搜索引擎优化是一个愈来愈复杂的任务。

经过许多专业的SEO研究机构调查后发现,当用户利用搜索引擎查找数据、产品或服务时,大部分人通常只会点击搜索结果当中,最前面出现的几个链接,因此,大部分的网站都希望能通过各种方式或手法来试图影响网站页面在搜索引击的排名。不过,搜索引擎的算法会不断的更新,网站的排名也会因此会有动荡,所以如果没有持续做好SEO,很快地排名就很有可能会掉下来。

早期搜索引擎

网站管理员以及网络内容提供者在90年代中期开始使用搜索引擎来优化网站。此时第一代搜索引擎开始对互联网分门别类。一开始,所有网站管理员得做的事只有提交所属网站到各家搜索引擎。这些引擎跑一些蜘蛛机器人(spider)──截取于网页程序中找到连至其他网页的超链接──并且存储所找到的数据。过程中同时包含了将网页下载并存储至搜索引擎拥有者的服务器中,这时有另外一个软件称为Indexer来截取页面中不同的信息——页面中的文字、文字的位置、文字的重要性以及页面所包含的任何链接,之后将页面置入清单中等待过些时日后,再来截取一次。随着在线文件数目日积月累,越来越多网站员意识到自然搜索 (有机搜索) 条目的重要性,所以较普及的搜索引擎公司开始整理他们的列表,以显示最恰当适合的网页为优先。搜索引擎与网站管理员的战争就此开始,并延续至今。

一开始搜索引擎是被网站管理员本身牵着走的。早期版本的搜索算法有赖于网站员提供信息,如关键字的基本定义标签(meta tag)。当某些网站员开始滥用标签,造成该网页排名与链接无关时,搜索引擎开始舍弃标签并发展更复杂的排名算法。由于数繁不及备载,仅枚举数个分析目标如下:

· 在标题签里的文字,如

引擎

· 域名,如 wikipedia.org

· 统一资源定位符下属的目录与档名,如 http://zh.wikipedia.org/wiki/Seo

· 关键字密度

· 关键字接近度,如 '软盘、软碟' '硬盘、硬碟'

· 图形链接的 Alt 属性,如

但是经过多年的搜索引擎算法的调整,现在较重要的影响标签为:

·

·

·

· 中的 alt属性

由于这些都还在网站人员的眼皮下打滚,搜索引擎陆陆续续碰到诸多滥用与操纵排名等难题。为了要提供较好的结果给用户,搜索引擎必须调适到让他们的搜索结果表现出最适当的结果,而非某些不道德的网络员产生的、只有塞满关键字的无用网页。由此,新种类的搜索引擎应运而生。

当代搜索引擎

Google由两名在斯坦福大学深造的博士生拉里·佩奇(Larry Page) 和谢尔盖·布尔(Sergey Brin)开始。他们带来了一个给网页评估的新概念,称为“网页级别” (PageRank),是Google搜索引擎算法[1]重要的开端。网页级别十分倚赖导入链接(incoming link),并利用这种每个导入某网页的链接相当于给该网页价值投一票的理论创建起逻辑系统。越多导入链接意味着该网页越有“价值”。而每个导入链接本身价值直接根据该链接从何而来的网页级别,以及相反的该页导出链接 (outgoing link) 。而在2009年的10月,Google网站管理工具正式移除了PageRank,而紧接着 Google 在2011年移除了 Firefox 的 Google Toolbar,并在2016年正式除 Google PageRank。

在网页级别帮助下,Google 在服务相关的结果上证明它相当优异。Google 成为了最普遍和最成功的搜索引擎。由于网页级别纳入站点外因子,Google认为它们会比页内因子难以动手脚。

然而网站员们已经开发出对付Inktomi搜索引擎的链接操作工具和计划。这些方法证明对Google 算法一样管用。许多站集中于交换、买卖大量链接。随着网站员寻求获取链接只单单要影响Google送更多流量给该站,而不管对站点访客是否有用,这种行为的增加,让网页级别对原始算法的信赖度渐渐被破坏了。

此时,是Google 和其它查寻引擎对广大范围的站外因子仔细查看的时候。开发更加聪明的算法有其他原因。互联网已经扩大到拥有并无相关技术的广大用户。他们经常无法使用先进的提问技巧来获取信息;而且他们得面对互联网比起发展早期更庞大数据、更复杂的索引。搜索引擎必须开发具备预测性、语义性、语言性和启发性算法。

目前,网页级别的缩小版仍然被显示在Google 工具条上,不过网页级别只不过是Google考虑在网页分级时超过100个因素里中的一个。

今天,大多数搜索引擎对它们的如何评等的算法保密。搜索引擎也许使用上百因素在排列目录;每个因素本身和因素所占比重可能不断地在改变。

大部分当代搜索引擎优化的思路──哪些有效、哪些没效──这些很大部分在于观察与根据内线消息来的猜测。某些优化员得在运行控制下的实验中获取不同最优化方法的结果。

尽管如此,以下是搜索引擎发展它们算法时的一些引用,一份Google的专利清单[4]也许可以让读者猜出他们会走哪条路线:

· 站点的年龄

· 自该网域注册后过多久

· 内容的年龄

· 新内容增加的规律性

· 链接的年龄,连接站点的名誉和其相关程度

· 一般站内因素

· 负面站内因素 (例如,太多关键字汇标(meta tag),很显然被优化过,会对站点造成伤害)

· 内容的独特性

· 使用于内容的相关术语 (搜索引擎关系到的术语的方式视同如何关系到网页的主要内容)

· Google网页级别 (只被使用在Google 的算法)

· 外在链接、外部链接的链接文字、在那些和在站点/网页包含的那些链接

· 引证和研究来源(表明内容是研究性质)

· 在搜索引擎数据库里枚举的词根与其相关的术语(如 finance/financing)

· 导入的逆向链接,以及该链接的文字

· 一些导入链接的负面计分 (或许那些来自低价值页、被交换的逆向链接等)

· 逆向链接获取速率:太多太快意味着“不自然”的链接购买活动

· 围绕在导出链接、导入的逆向链接周围的文字。例如一个链接如果被 "Sponsored Links" (赞助商链接)包围,该链接可能会被忽略。

· 用 "rel=nofollow" 建议搜索引擎忽略该链接

· 在站点该文件的结构深度

· 从其他资源收集的网格表,譬如监视当搜索结果导引用户到某页后,用户有多频繁按浏览器的返回

· 从来源像:Google AdWords/AdSense、Google 工具条等程序收集的网格表

· 从第三方数据分享协议收集的网格数据 (譬如监测站点流量的统计程序提供商)

· 删除导入链接的速率

· 使用子网域、在子网使用关键字和内容品质等等,以及从这些活动来的负面计分

· 和主文件语义上的链接

· 文件增加或改动的速率

· 主机服务商 IP 和该 IP 旗下其它站点的数量/品质

· 其他链接站会员 (link farm / link affiliation) 与被链接的站 (他们分享IP吗? 有一个共同的邮递地址在"联系我们 (Contact Us)" 页吗?)

· 技术细节像利用301重定向被移除的网页、对不存在网页显示404服务器标头而非200服务器标头、适当的利用 robots.txt

· 主机服务商正常运行时间

· 是否站点对不同类的用户显示不同的内容(称为“掩饰”(cloaking))

· 未及时矫正、无效的导出的链接

· 不安全或非法内容

· HTML代码品质,以及错误出现数

· 由搜索引擎自他们搜索结果观察到的实际点击通过率评等

· 由最常访问搜索结果的人手动评等