星际争霸与人工智能## 星际争霸与人工智能 阿里巴巴认知计算实验室 龙海涛 ## Why StarCraft?  300/300 300/300 Psi Used: 120 ## Protoss Pylon Psi Provided: 8 Total0 码力 | 24 页 | 2.54 MB | 2 年前3
动手学深度学习 v2.0模型在ImageNet数据集上的训练时间减少到不到7分钟。作为比较——最初的训练时间是按天为单位的。 · 并行计算的能力也对强化学习的进步做出了相当关键的贡献。这导致了计算机在围棋、雅达里游戏、星际争霸和物理模拟(例如,使用MuJoCo)中实现超人性能的重大进步。有关如何在AlphaGo中实现这一点的说明,请参见如(Silver et al., 2016)。简而言之,如果有大量的(状态、动作、奖 量(Shao et al., 2020)。 ## 强化学习 强化学习(reinforcement learning)强调如何基于环境而行动,以取得最大化的预期利益。国际象棋、围棋、西洋双陆棋或星际争霸都是强化学习的应用实例。再比如,为自动驾驶汽车制造一个控制器,或者以其他方式对自动驾驶汽车的驾驶方式做出反应(例如,试图避开某物体,试图造成事故,或者试图与其合作)。 ## 考虑到环境 上述不0 码力 | 797 页 | 29.45 MB | 2 年前3
【PyTorch深度学习-龙龙老师】-测试版202112Roboschool、DeepMind OpenSpiel、MuJoCo 等,常用的强化学习算法有 DQN、A3C、A2C、PPO 等。在围棋领域,DeepMind AlaphGo 程序已经超越多名人类围棋专家;在 Dota2 和星际争霸游戏上,OpenAI 和 DeepMind 开发的智能程序也在限制规则下战胜了顶级职业队伍。 机器人(Robotics) 在真实环境中,机器人的控制也取得了一定的进展。如 UC Berkeley0 码力 | 439 页 | 29.91 MB | 2 年前3
共 3 条
- 1













