ChineseBERT使用指北

ChineseBert 模型介绍

论文地址:https://arxiv.org/pdf/2106.16038.pdf
代码地址:https://github.com/ShannonAI/ChineseBert

bert是语义模型,因此无法解决形近字、音近字的问题。
ChineseBERT主要引入了文本的拼音编码和字形编码解决上述问题。

开源代码使用方法

  1. 下载上面地址的代码作为你的project
  2. 下载ChineseBERT模型到project下的一个文件夹,命名为ChineseBERT-base
  3. 在上面的文件夹下安装git-lfs并初始化(以Linux系统即我们常用的服务器为例):
# git lfs是大型代码管理工具Large File Storage,在BERT等大型预训练模型中
sudo apt-get install git-lfs
git lfs install
git lfs pull
  1. 如果提示import代码错误,可能是transformer版本不一致导致的,可以直接去百度相应解决办法,总有前人替你踩过了许多坑。

未完待续

居中并且带尺寸的图片: Alt