星际争霸 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

星际争霸与人工智能

## 星际争霸与人工智能阿里巴巴认知计算实验室龙海涛 ## Why StarCraft? ![Image](/uploads/documents/1/6/e/e/16ee01f4b8abb96b2fb44e1f1fbd0521/p2_2.jpg) 300/300 300/300 Psi Used: 120 ## Protoss Pylon Psi Provided: 8 Total

0 码力 | 24 页 | 2.54 MB | 2 年前
3
动手学深度学习 v2.0

模型在ImageNet数据集上的训练时间减少到不到7分钟。作为比较——最初的训练时间是按天为单位的。 · 并行计算的能力也对强化学习的进步做出了相当关键的贡献。这导致了计算机在围棋、雅达里游戏、星际争霸和物理模拟（例如，使用MuJoCo）中实现超人性能的重大进步。有关如何在AlphaGo中实现这一点的说明，请参见如(Silver et al., 2016)。简而言之，如果有大量的（状态、动作、奖量(Shao et al., 2020)。 ## 强化学习强化学习（reinforcement learning）强调如何基于环境而行动，以取得最大化的预期利益。国际象棋、围棋、西洋双陆棋或星际争霸都是强化学习的应用实例。再比如，为自动驾驶汽车制造一个控制器，或者以其他方式对自动驾驶汽车的驾驶方式做出反应（例如，试图避开某物体，试图造成事故，或者试图与其合作）。 ## 考虑到环境上述不

0 码力 | 797 页 | 29.45 MB | 2 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

Roboschool、DeepMind OpenSpiel、MuJoCo 等，常用的强化学习算法有 DQN、A3C、A2C、PPO 等。在围棋领域，DeepMind AlaphGo 程序已经超越多名人类围棋专家；在 Dota2 和星际争霸游戏上，OpenAI 和 DeepMind 开发的智能程序也在限制规则下战胜了顶级职业队伍。机器人(Robotics) 在真实环境中，机器人的控制也取得了一定的进展。如 UC Berkeley

0 码力 | 439 页 | 29.91 MB | 2 年前
3

共 3 条前往

页

多智能体协作星际争霸实时对抗策略长期规划时空推理深度学习端到端训练特征工程参数统计描述非参数模型 PyTorch 张量动态图神经网络

分类

语言

格式

星际争霸与人工智能

动手学深度学习 v2.0

【PyTorch深度学习-龙龙老师】-测试版202112

搜索

分类

语言

格式

星际争霸与人工智能

动手学深度学习 v2.0

【PyTorch深度学习-龙龙老师】-测试版202112