我想你也许知道那个别人不知道的视频吧。
但从标题的裁切中可以发现,百度所谓的中文分词能力也不过如此。
1、示例
SEO | 网络使用技巧,电脑使用技巧,网站SEO知识,互联网资讯–we..
* 汉字:21
* 英文:8
* 其他:8
* 空格:2
总共:60
Yahoo | web1986–网络使用技巧,电脑使用技巧,网站SEO知识,互…
* 汉字:17
* 英文:11
* 其他:9
* 数字:4
* 空格:2
总共:60
网球|费德勒|纳达尔|德约科维奇|伊万诺维奇|莎娃|扬科维奇|李宁网..
* 汉字:27
* 其他:7+2=9
总共:63
2、规则
* 据统计,百度对标题的长度的限制应该是63个字符。
* 当标题长度超过限制时,百度同样进行切割,但其结尾有两种:“..”“…”,与Google的“空格…”不一样。
* 百度的分词可谓高深莫测,就如上面例子,它竟然把“web1986”切成“we”,整个标题总长度其实也就60,如果再补上个“b”也就61,明明还没达到长度限制,为什么却要如此生硬地裁切呢?再如“李宁网易体育”,难道百度会不知道网易?竟然把“网易”的“网”给切走了?
* 在针对百度的规则写标题时,最好往短里写,因为你不知道百度可能怎么裁切。
3、研究标题裁切规则的意义
为什么你需要知道搜索引擎是怎样裁切标题的?
从百度对标题的裁切你就可以得到其意义了,那就是防止出现任何的歧义,增加可阅读性。
假如都像百度那样切割,那么总有一天会出现“傻大木真的没有生产制造大规模杀伤性武器”与“吗?”分开的结局了—啊?看不懂这个笑话,那搜索引擎里搜索一下吧。