欢迎光临
我们一直在努力

百度对标题的裁切规则

在我的记忆中,百度似乎对自己的中文分词能力异常得意的:你知道我不知道,我知道你不知道,我知道,你不知道,你知道我,不知道……到底你知不知道????

我想你也许知道那个别人不知道的视频吧。

但从标题的裁切中可以发现,百度所谓的中文分词能力也不过如此。
1、示例

SEO | 网络使用技巧,电脑使用技巧,网站SEO知识,互联网资讯–we..

    * 汉字:21
    * 英文:8
    * 其他:8
    * 空格:2

总共:60

Yahoo | web1986–网络使用技巧,电脑使用技巧,网站SEO知识,互…

    * 汉字:17
    * 英文:11
    * 其他:9
    * 数字:4
    * 空格:2

总共:60

网球|费德勒|纳达尔|德约科维奇|伊万诺维奇|莎娃|扬科维奇|李宁网..

    * 汉字:27
    * 其他:7+2=9

总共:63

2、规则
     * 据统计,百度对标题的长度的限制应该是63个字符。
    * 当标题长度超过限制时,百度同样进行切割,但其结尾有两种:“..”“…”,与Google的“空格…”不一样。
    * 百度的分词可谓高深莫测,就如上面例子,它竟然把“web1986”切成“we”,整个标题总长度其实也就60,如果再补上个“b”也就61,明明还没达到长度限制,为什么却要如此生硬地裁切呢?再如“李宁网易体育”,难道百度会不知道网易?竟然把“网易”的“网”给切走了?
    * 在针对百度的规则写标题时,最好往短里写,因为你不知道百度可能怎么裁切。

3、研究标题裁切规则的意义

为什么你需要知道搜索引擎是怎样裁切标题的?

从百度对标题的裁切你就可以得到其意义了,那就是防止出现任何的歧义,增加可阅读性。

假如都像百度那样切割,那么总有一天会出现“傻大木真的没有生产制造大规模杀伤性武器”与“吗?”分开的结局了—啊?看不懂这个笑话,那搜索引擎里搜索一下吧。

 

赞(0) 打赏
未经允许不得转载:优友网 » 百度对标题的裁切规则
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

大前端WP主题 更专业 更方便

联系我们联系我们

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏