或者

网站代码SEO优化(清理垃圾代码)

作者:浅色记忆 浏览:105 发布时间:2017-12-07
分享 评论 0

 清理垃圾代码是指删除页面中的多余代码。一个页面经过垃圾代码清理后,可以删除接近80%的多余代码。然而,什么样的代码才是垃圾代码呢?

  1.垃圾代码简

  垃圾代码就是指删除后不会影响页面正常显示的非必要的代码。这些代买占据着庞大的空间,不但消耗用户下载页面的时间,还占用搜索引擎巨大的存储空间,增加搜索引擎分析数据的时间。然而,这么庞大的垃圾代码是如何产生的呢?

  2.垃圾代码的产生

  一般情况下,我们会使用网页制作软件制作网页,如FrontPage、Word及Dreamweaver。这些网页制作软件在制作网页的时候,会生成相应的HTML代码,其中大部分是必要的,而有一小部分则是可有可无的,这就是所谓的垃圾代码。因此,避免产生垃圾代码最好的办法就是以手工编写代码的方式制作网页。

  即使是同样内容的网页,使用不同的网页制作软件进行制作,所产生的代码也会存在很大的区别。在没有掌握手工编写代码前,可以使用Dreamweaver制作网页,完成后再清理其中的垃圾代码。

  3.垃圾代码的清理

  〇空格

  空格字符是网页中最常见的垃圾代码。但此处讨论的空格字符并非HTML语言中的“ ”标签,而是指在代码编辑环境下敲击键盘上的空格键所产生的符号。网页中每个空格都相当于一个字符,因此,空格字符也会占用巨大的空间。初步同济,空格字符约占用页面总体积的1.5%。也就是说,一个100KB的页面中,其中1.5KB是空格字符。

  空格字符通常会出现在每行代码的开始和结束处,还有就是空行中。

  (1)每行代码开始前的空格字符:是网页制作软件生成代码时,默认产生的缩进字符。

  (2)每行代码结束处的空格字符:是编辑HTML代码时,不小心加上的。只要我们在每行代码的结束位置向右移动光标,如果光标不换行,则说明该页面还存在空格字符。

  (3)空白行:在编写代码时,常利用空行或者注释对不同功能模块进行分隔,这样就产生了空白行。

  对于页面中不同位置上的空格字符,清理的方式也有嗦不同,下面介绍几种常用的空格字符清理方法。

  每行代码开始前的空格字符

  对于每行代码开始钱的空格字符,可以使用Dreamweaver或者EditPlus等软件进行清理。具体操作步骤如下:

  (1)转至HTML代码编辑模式(如果是Dreamweaver);

  (2)按Ctrl+A选择全部代码;

  (3)使用组合键Shift+Tab,直至删除所有空格为止。

  下面的代码1是清理空格前的效果,而代码2则是清理空格字符后的效果。

  代码1:

  <table width="100%" border="0" cellsoacing="0" cellpadding="0">

  <tr>

  <td>&nbsp;</td>

  </tr>

  <tr>

  <td>&nbsp;</td>

  </tr>

  <tr>

  <td>&nbsp;</td>

  </tr>

  </table>

  代码2:

  <table width="100%" border="0" cellsoacing="0" cellpadding="0">

  <tr>

  <td>&nbsp;</td>

  </tr>

  <tr>

  <td>&nbsp;</td>

  </tr>

  <tr>

  <td>&nbsp;</td>

  </tr>

  </table>

  空行

  对于空行中空格字符的清理,只能手工逐行去掉。

  (1)首先,使用鼠标选择空行;

  (2)再按Delete键,即可删除空行。

  每行代码结尾处的空格字符对于每行代码介绍处的空格字符,我们可以使用Editplus或者其他文笔编辑软件的替换功能进行清理:

  (1)用鼠标选择“>”+“一个空格字符”,即“>”;

  (2)再按Ctrl+F,就会弹出一个窗口;

  (3)“替换”处填上“>”,再点击“全部替换”即可。

  页面经过清理空格字符后,大概可以删除70%左右的垃圾代码。也就是说,空格字符的代码量大概占总垃圾代码的70%,还有30%左右的垃圾代码分布在默认属性、注释语句及空语句中。

  〇默认属性

  在利用网页制作软件制作网页时,通常会产生一些默认属性的代码。例如,我们在HTML代码中不添加左对齐属性,页面中的内容也是以左对齐的方式显示的,所以代码中的左对齐属性是可以删除的。

  在页面中,还有很多其他属性都是默认属性,以下是比较常见的。

  (1)align=“left”:横向居左对齐属性值,默认情况下文章或者图片都是横向居左对齐的。

  (2)valign=“middle”:竖向居中对齐属性值,默认情况下文章或者图片都是竖向居中对齐的。

  (3)size=“3”:文字大小属性值,默认情况下是3号字体。

  (4)target=”_self“:新页面打开属性值,默认情况下网页中文本的字体颜色是黑色。

  利用Dreamweaver的替换功能,可以完成对默认属性代码的替换。在“查找”中填上要替换的默认属性代码,“替换”处留空白,还可以在“查找范围”上选择替换范围,然后点击“替换全部”就可以删除“产照范围”内所有指定的默认属性代码。

  〇注释语句

  注释语句是用于对代码功能或作用进行说明的语句,注释语句里的内容对于普通用户来说就是不可见的。即普通用户在页面中是看不到HTML代码中注释标签里的内容。

  在制作网页的时候,我们或多或上会添加注释语句一增强代码的可读性。但是,过多的注释语句会占用大量的存储空间。不仅如此,如果在注释标签里添加大量的关键字,还会被搜索引擎认为是堆砌关键字,从而对网站进行惩罚。

  所以,在添加注释语句时,我们要坚守一个院长:绝不添加哪些即使删除后也不会影响网页源代码可读性的注释语句。

  〇空语句

  垃圾代码清理的最后一步就是删除代码中的空语句。简单地说,空语句就是指标签间不存在任何内容的语句。

  空语句的清理主要针对即使删除后也不会影响页面正常显示的标签。但有一部标签是不能删除的(如<tr>、<td>),否则页面将会出现错乱。

  手工编写HTML代码是搜索引擎优化从业者必须具备的基本技能。如果你已经具备手工编写HTML代码的能力,就应该有限采用手工编写代码的方式制作网页。

  经过垃圾代码清理后,页面中70%以上的多余代码已经被清楚,但是,精简代码的工作并没有完成。接下来就是暂缓HTML中的长标签,以及对CSS,JavaScript进行优化,