基于大语言模型的规划

2024-11-09 21:35:40

文章目录

- 整体框架
- 方案生成
- 反馈获取

虽然上下文学习和思维链提示方法形式上较为简洁且较为通用，但是在面对诸如几何数学求解、游戏、代码编程以及日常生活任务等复杂任务时仍然表现不佳。为了解决这类复杂任务，可以使用基于大语言模型的规划（Planning）。该方法的核心思想在于将复杂任务分解为若干相关联的子任务，并围绕这些子任务制定包含一系列执行动作（Action）的解决方案，从而将复杂任务的求解转换为一系列更为简单的子任务依次求解，进而简化了任务难度。

整体框架

如下图所示，基于大语言模型的规划方法主要由三个组件构成，包括任务规划器（TaskPlanner）、规划执行器（PlanExecutor）以及环境（Environment）。具体来说，大语言模型作为任务规划器，其主要职责是生成目标任务的解决方案。该方案包含一系列执行动作，每个动作通过合适的形式进行表达，例如自然语言描述或代码片段。对于长期任务，任务规划器还可以引入存储机制，用于解决方案与中间执行结果的存储与检索。规划执行器则负责执行解决方案中所涉及到的动作。根据任务性质的不同，规划执行器可以由大语言模型实现，也可以由执行具体物理任务的实体（如机器人）来实现。环境是规划执行器实施动作的具体场景，不同任务对应着不同的执行环境，例如Web互联

码农公寓

文章目录

整体框架

相关文章