5. 使用更大的模型
另外一种思路是直接增大模型。如果我们的模型缺少外界世界的信息,那么为什么不把模型做大一点,直接让模型具备更多的世界表征?而这就涉及到之前Hans Uszkoreit(德国人工智能研究中心科技总监、北京人工智能技术中心总监兼首席科学家)所讲的:创建一个大型的知识库,特别是要从网络文档中抓取信息。
当然,这样做也存在一个通病。每当给一个模型增加一个新的组成部分,那么这个模型就会多一个出错的可能性。如果你在用这个模型做推理工作,那么很可能会出现错误。这实际上是另外一种过拟合问题。
当我们想要避免额外错误时,就需要让知识库保持简单。