MkDocs 主题的中文搜索有点弱

最开始是想着在自己的站点通过 “体积” 的关键词搜索《解决 GitHub 提交次数多导致仓库体积过大的问题》这篇文章,但死活就是搜不到。

tiji-shenwy

换成 “次数”“次数多” 这个关键词还是搜不到。

cishuduo-shenwy

后来换成 “提交”“提交次数” 反倒是搜索出来了。

tijicishu-shenwy

同样的问题在 Material for MkDocs 官方站点 同样也是不如人意。

sousuo-mkdocs

zhongwen-mkdocs

zhichi-mkdocs

从现有的一些资料可以看到这其实是中文分词,文本​没有被​正确​分割​导致的,参考官方给的方案可以比较好解决这个问题。

  1. 安装 jieba
    pip install jieba
    
  2. 指定了 separator 配置
    plugins:
      - search:
          separator: '[\s\u200b\-]'
    

最后,重新构建站点,就可以看到文章开头提到的,通过 “体积” 的关键词搜索《解决 GitHub 提交次数多导致仓库体积过大的问题》这篇文章,已经可以正常搜索。

tiji-shen-ok