以下记录rasa基本的配置,以及调试过程。首先用rasa init 生成一个初始的文件目录。
1、最简单的中文配置
打开项目根目录下的 config.yml 配置文件,修改如下:
recipe: default.v1
language: zh
pipeline:
- name: JiebaTokenizer
- name: LanguageModelFeaturizer
model_name: "bert"
# 下载中文模型,并指定路径
model_weight: "bert-base-chinese"
- name: "DIETClassifier"
国内使用的话,会遇到无法从 huggingface 下载模型,可使用国内的镜像
2、配置 nlu.yml
修改 data/nlu.yml,在已有的英文语料基础上,增加一些中文的语料。
version: "3.1"
nlu:
- intent: greet
examples: |
- hey
- hello
- hi
- hello there
- good morning
- good evening
- moin
- hey there
- let's go
- hey dude
- goodmorning
- goodevening
- good afternoon
- 你好!
- 您好!
- 在么!
- 在吗!
- 喂!
- intent: goodbye
examples: |
- cu
- good by
- cee you later
- good night
- bye
- goodbye
- have a nice day
- see you around
- bye bye
- see you later
- 拜拜!
- 再见!
- 拜!
- 退出。
- 结束。
- exit
- intent: affirm
examples: |
- yes
- y
- indeed
- of course
- that sounds good
- correct
- 是的
- 是
- intent: deny
examples: |
- no
- n
- never
- I don't think so
- don't like that
- no way
- not really
- 不
- 不是的
- 不是
3、重新训练模型
rasa train nlu
4、测试模型:
rasa shell nlu
5、重新训练
由于之前用 rasa train nlu 训练出来的模型只是解析,并不包含回复逻辑,所以需要重新训练。
注意,不要带 nlu 参数:
rasa train
6、启用了 rasa server
再次启动 rasa shell,会看到同时启用了 rasa server, 并加载了新训练的模型文件。
rasa shell