《中国人工智能学会通讯》——11.39 结束语

11.39 结束语

本文基于近似动态规划对若干优化控制问题进行了深入研究,通过利用神经网络作为在线参数结构,首先提出了以因果关系同时得到跟踪控制器的反馈项和前馈项的新理论,以及数据驱动 ADP 算法实现以在线方式获得系统的最优跟踪控制器;其次提出了基于 ADP 在线自适应策略学习方案,解决了离散时间非线性系统在线 H ∞优化控制问题;接着,利用一个非二次型泛函克服了执行饱和约束问题,同时通过引入协状态函数而消除求解约束 HJB方程中的导数项和积分项,提出了两级迭代二次启发式规划算法,有效解决了在不等式约束下 HJB 方程在线求解难题;最后,设计了基于 ADP 设计了数据驱动 H ∞鲁棒负荷频率控制器 , 有效提高了电力系统的鲁棒控制性能。尽管我们基于 ADP 理论解决了动态系统若干最优控制问题,取得了一些研究成果,但是仍然有很多问题需要进一步解决。如本文只是利用 ADP 研究了离散时间切换系统的最优控制问题,然而,如何利用 ADP 解决连续时间切换系统最优控制问题,建立完善的切换系统 ADP近似最优控制理论是一个值得深入研究的方向。

上一篇:ImageNet 2017目标定位冠军论文:双路径网络


下一篇:好程序员web前端分享高度自适应