或者

百度中文分词

作者:徐小样 浏览:1177 发布时间:2017-05-22
编辑 分享 评论 0

首先根据分割符号将查询分开,然后看看是否有重复的字符串,如果有,就抛弃多余的,只保留一个,接着判断是否有英文或者数字,如果有的话,把英文或者数字当作一个整体保留并把前后的中文切开。

如果字符串只包含小于等于3个中文字符的话,那就保留不动,当字符串长度大于4个中文字符的时候,百度的分词程序才出马大干快上,把这个字符串肢解掉。

评论(0人参与,0条评论)

发布评论

最新评论

词条统计

  • 浏览次数:1177
  • 编辑次数:0次历史版本
  • 最近更新:2017-05-22
  • 创建者:徐小样
  • 相关词条

    相关问答

    相关百科

    相关资讯