中国人工智能学会通讯——金融博弈下的价值学习 1.1 多代理环境下的博弈与学习

中国人工智能学会通讯——金融博弈下的价值学习  1.1 多代理环境下的博弈与学习

1.1 多代理环境下的博弈与学习

我们考虑的是多代理环境下的博弈与学习。对于通常情况下的机器学习,我们有很多的知识了解,那么在我们不知道的环境下该怎么处理?这种情况下我们考虑的是对抗性学习和博弈学习。这样的应用目前已经越来越多,特别是在金融和经济学里。

中国人工智能学会通讯——金融博弈下的价值学习  1.1 多代理环境下的博弈与学习

关于对抗性学习,前面的报告提到GAN的网络,在这方面我们也可以考虑到反垃圾邮件时,filter要经常转变。

博弈学习是另外一种情况,博弈学习时,并不是完全对抗的,可能还会合作。在这种情况下我们对学习有什么样的理解。

中国人工智能学会通讯——金融博弈下的价值学习  1.1 多代理环境下的博弈与学习

这里最重要的一点是,我们有时并不知道价值究竟是什么样的。这种情况下,每个人的价值就是他自己的一种私有信息。在市场上,每个人有自己的追求和市场选择。在这里,我们可以讨论的问题一个是市场的均衡;还有一个比较流行的是在拍卖理论里面有诚实机制的分析。在这种程度上,我们有一定的知识和能力。

为什么要考虑这样的情况?因为这种情况在互联网竞技中很常见。比如说,通常我们看到的搜索广告。一开始时大家并不知道在网上放一个广告能值多少钱。广告主投放广告以后,他们会得到越来越多的知识。这种情况下,就有一个相互学习的过程,使得我们知道它的价值究竟有多大。另外一个是我们可以经常看到的折扣设计,谁也不知道买家需要多少折扣才愿意买东西。

上一篇:C#反编译工具 ILSPY-x64可动态调试-君临汉化版


下一篇:winfrom 下 listbox 选项添加value