或者

分析百度数据开放平台标题长度限制和截断条件注解

作者:冬瓜神祇 浏览:206 发布时间:2017-08-29
分享 评论 0

《百度搜索开放平台现有展示模板的 xml 格式样例及规范》里另一条注释。
资源所在页面的链接地址,用于显示在搜索结果的下方。不需要有 "http://" 的部分;Showurl 的长度限制为 2-42 字节,如果超过 42 字节,请截断,并增加省略符号 "…",并保证截断后的 showurl 加上省略符号总长度不超过 42 字节。
百度没有直接提及网页搜索结果展现标题截断字节数的上下限,所以我将《样例及规范》的两处注释结合如下

使用主流的中文环境操作系统,浏览器等(字符编码为 UTF-8, GB2312, BIG5 等),展示在百度中文搜索结果页(字符编码为 UTF-8, GB2312, BIG5 等)的网页型标题,长度限制为 3-63 字节(2 byte < title 长度 < 64 byte),如果 F 参数所指的标题策略是 F2 = xxxxxx6B,短于 3 字节或超过 63 字节的非百度产品的普通结果(AS)会自动截断,并增加省略符号 "…",截断后加上省略符号的 title 长度限制为 3-64 字节。

百度设置一个不符合现实常见的标题长度,可能是技术导向公司单纯地想不到标题长度亦是用户体验一部分。只是从计算机本身二进制的规则角度考虑,最长 64 字节,抓取过来标题长度超出 63 的多了去了,不显示浪费资源。机械的把 8 的平方作为标题长度。一直到了智能手机上,百度算是改变了愚昧做法,把字节数改成 3 - 52 字节。