星际争霸与人工智能
星际争霸与人工智能 阿里巴巴认知计算实验室 龙海涛 Why StarCraft? Challenge Problems for Artificial Intelligence Imperfect Information Huge State and Action Space Long-Term Planning Temporal and Spatial Reasoning0 码力 | 24 页 | 2.54 MB | 1 年前3【PyTorch深度学习-龙龙老师】-测试版202112
Roboschool、DeepMind OpenSpiel、MuJoCo 等,常用的 强化学习算法有 DQN、A3C、A2C、PPO 等。在围棋领域,DeepMind AlaphGo 程序已经 超越多名人类围棋专家;在 Dota2 和星际争霸游戏上,OpenAI 和 DeepMind 开发的智能程 序也在限制规则下战胜了顶级职业队伍。 机器人(Robotics) 在真实环境中,机器人的控制也取得了一定的进展。如 UC Berkeley0 码力 | 439 页 | 29.91 MB | 1 年前3动手学深度学习 v2.0
量 (Shao et al., 2020)。 强化学习 强化学习(reinforcement learning)强调如何基于环境而行动,以取得最大化的预期利益。国际象棋、围棋、 西洋双陆棋或星际争霸都是强化学习的应用实例。再比如,为自动驾驶汽车制造一个控制器,或者以其他方 式对自动驾驶汽车的驾驶方式做出反应(例如,试图避开某物体,试图造成事故,或者试图与其合作)。 考虑到环境 上述不同0 码力 | 797 页 | 29.45 MB | 1 年前3
共 3 条
- 1