中国人工智能学会通讯——构建强健的人工智能:原因及方式 5. 使用更大的模型

2022-05-07 10:41:43

另外一种思路是直接增大模型。如果我们的模型缺少外界世界的信息，那么为什么不把模型做大一点，直接让模型具备更多的世界表征？而这就涉及到之前Hans Uszkoreit（德国人工智能研究中心科技总监、北京人工智能技术中心总监兼首席科学家）所讲的：创建一个大型的知识库，特别是要从网络文档中抓取信息。

当然，这样做也存在一个通病。每当给一个模型增加一个新的组成部分，那么这个模型就会多一个出错的可能性。如果你在用这个模型做推理工作，那么很可能会出现错误。这实际上是另外一种过拟合问题。

当我们想要避免额外错误时，就需要让知识库保持简单。

码农公寓