Brief Guide
项目 | 内容 |
---|---|
这个作业属于哪个课程 | 北航人工智能实战课 |
这个作业的要求在哪里 | 第三次作业要求 |
我在这个课程的目标是 | 获得机器学习相关的完整项目与学习经验;通过与人工智能行业的大牛们聊天了解行业不同方向的发展以便进行职业规划;为转CS积累基础知识并获得相关课程的成绩 |
这个作业在哪个具体方面帮助我实现目标 | 通过练习黄金点游戏,掌握强化学习的使用 |
作业正文… | 【王俊杰de人工智能实战课】第7次作业2 |
其他参考文献… | 微软AI教育GitHub |
Main Homework
1 黄金点游戏介绍
黄金点游戏是指N个玩家提交各一个(0,100)的数,求这N个数的平均数,再将平均数乘以0.618,与结果最近的同学获得此轮胜利并获得积分。然后进入下一轮游戏。在一定轮数的游戏结束后,统计所有玩家的总成绩,总成绩最高的玩家获胜。
2 黄金点游戏中的Trick
- 该游戏本质是一个基于时序序列的预测问题。根据已有的所有玩家的出分结果与最后的总结果对于下一轮结果的可能值进行预判,自己提交该结果以获得此轮胜利。
- 更进一步的策略是,在预测下一轮结果的同时,偶尔随机的改变自己的出分,以迷惑其他选手,让其他选手找不到自己的出分规律。(即在时序序列中加入随机噪声)
3 我的策略
- 先指定每一轮都输出同一个数,第二次游戏时输出另一个数,第三次游戏的时候再换一个数,反复五次。提取每一个玩家(robot)的出分序列,对其进行分析,找出其中一些出分规律特别明显的玩家(如每轮都随机,或本轮出分等于上一轮结果,或每轮都出同一个数……)
- 确定一部分玩家的出分策略后,将其的处分策略纳入考虑范围,优化自己的出分。(随机出分的视为每次都出随即范围的均值,其余的按其原有规律)
- 用moving average的方法,对剩余的每一个玩家的出分序列进行移动平均,以此策略优化自己的出分,测试几次游戏,看一看结果如何。