12月初,我主要在看王薇老师14年[1]和17年[2]那两篇Auto文章,学习如何利用backstepping方法解决高阶不确定非线性多智能体系统跟踪控制问题。王老师论文与其他相关论文对比,其主要创新是,在高阶模型下,不与领导者相连的节点也不需要知道参考信号及其各阶的导数,只是理论分析上需要用到dot_yd的上界,控制器中并不需要。我利用其结果,推导了一个二阶可参数化严格反馈系统结果,用于完成宋老师《高级控制理论》课程作业。从自己的仿真结果来看,该算法由于利用了backstepping技术,因此在求各偏导信号时十分复杂,尤其是在MAS框架下各个节点之间存在耦合的情况下;此外,其控制器或虚拟控制器α1的波形抖振也很严重,个人感觉并不太好,也可能是参数没有调节好。该课程作业还没写好,还剩introduction部分,准备周末完成。
同时,我还推导了k滤波[3],但难度太大,并没有推出来,张师姐下周会作报告详细讲解。
12月8日,我开始看强化学习[4-9],python[10,11]和凸优化[12]。主要先学习了MDP,python的一些基础语句。这里列出相关的学习资料用于方便后续继续学习。
12月16日,我开始看传感器网络定位。主要基于以下三篇文章。[13-15]
在看传感器网络定位时,发现自己针对刚性图、方位刚性理论、距离刚性理论等概念完全不了解,目前正在一边看文章,一边扩充这些基础知识。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
相关文献:
【1】Wang W , Huang J , Wen C , et al. Distributed adaptive control for consensus tracking with application to formation control of nonholonomic mobile robots[J]. Automatica, 2014, 50(4):1254-1263.
【2】Wang W , Wen C , Zhou J . Distributed adaptive control for consensus tracking with application to formation control of nonholonomic mobile robots[J]. Automatica, 2017.
【3】M. Krsti´c, I. Kanellakopoulos, and P. Kokotovi´c, Nonlinear and Adaptive Control. New York: A Wiley-Interscience Publication, John Wiley & Sons, INC., 1995.
【4】Bertsekas's book: 《reinforcement learning and optimal control》
【5】Frank's book:《Handbook of reinforcement learning and control》
【6】《多智能体机器学习强化学习方法》
【7】《深入浅出强化学习原理入门》
【8】忆臻 - 知乎
【10】【Python教程】《零基础入门学习Python》最新版_哔哩哔哩_bilibili
【12】Stephen Boyd, Lieven Vandenberghe, 《凸优化(Convex Optimization) 》
【13】X. Fang, X. Li and L. Xie, "Angle-Displacement Rigidity Theory With Application to Distributed Network Localization," in IEEE Transactions on Automatic Control, vol. 66, no. 6, pp. 2574-2587, June 2021, doi: 10.1109/TAC.2020.3012630.
【14】Zhao S , Zelazo D . Localizability and distributed protocols for bearing-based network localization in arbitrary dimensions[J]. Automatica, 2016, 69(C):334-341.
【15】G. Jing, C. Wan and R. Dai, "Angle-Based Sensor Network Localization," in IEEE Transactions on Automatic Control, doi: 10.1109/TAC.2021.3061980.