中文NLP的一些经典算法实现,只专注于中文NLP领域的算法实现。
作为NLPer,平时工作或者学习中会遇到各种各样的模型,本项目主要是用来记录自己觉着比较有意思的一些模型。
代码结构随时可能会调整,不建议直接复制粘贴,仅供参考各任务的实现方式。
在开始运行代码之前,请先执行
source initial_environment.sh如果你对本项目感兴趣,或是想要玩一玩项目中的代码,注意阅读对应目录下的 README.md 文件。
关于Python版本,推荐使用 Python3.8 ,其他Python版本没有做过测试。
conda create -n zh_nlp python=3.8
conda activate zh_nlp用到的第三方库见 requirements.txt
pip install --upgrade pip
pip install -r requirements.txt部分代码用到了PaddlePaddle,安装请参考这里
NLP 有关的机器学习任务列表
- 文本分类
- 序列标注
- 关系抽取
- 文本匹配
- 摘要抽取
- 对话生成
后续会陆续添加训练模型相关的技巧
- 训练过程记录,日志相关
- loss/acc 日志
- tensorboard
- checkpoint
- 模型训练优化器相关
- 经典优化算法 optimizers
- 学习率调度器
- warmup 策略
- 对抗训练
- 模型压缩
- 模型部署
- 模型可视化