>科技>>正文

最新|Dota沦陷:OpenAI狂虐Dota2世界冠军

原标题:最新|Dota沦陷:OpenAI狂虐Dota2世界冠军

导读:OpenAI 的 机器人刚刚在 Dota2 1v1 比赛中战胜了人类顶级职业玩家 Denti。以建设安全的通用人工智能为己任的 OpenAI,通过“Self-Play”的方式,从零开始训练出了这个机器人。

8月12日消息 在Dota 2国际邀请赛上Open AI公司的机器人在Dota2 1v1比赛中战胜了Dota人类顶级职业玩家Dendi。至此,继横扫人类国际象棋大师和围棋大师后,人工智能如今又将风靡全球的电子竞技游戏Dota2攻陷。

据外媒现场报道,从双方的比赛状态和战况来看,双方交锋过程中,第一局Open AI机器人仅用10分钟就击败了Dendi,第二局比赛中,Dendi主动放弃比赛,并拒绝进行第三场比赛。

比赛期间,Open AI公司的机器人表现是非常“强悍”的,不仅会卡兵、s补刀,还会s掉技能抬手,其进攻性超强,连续两局狂虐Dendi。如此“强悍”的Open AI机器人手法娴熟,出手“快”、“准”、“狠”,刀刀毙命,这不禁令Dendi求饶:“请放过我吧。”

据悉,以建设安全可靠的通用人工智能为己任的 Open AI,通过“自我学习(Self-Play)”从零开始训练这款电子竞技机器人。赛前,Open AI CTO Greg Brockman对外透露了该款机器人在Open AI的指导下经历了一千次比赛的训练。Brockman 还声称这个 bot 已经打败多个世界级职业玩家。接下来,该公司表示将要转战研究5V5,未来战胜人类世界级玩家不是“梦”。

OpenAI 的 CTO Greg Brockman 在赛前介绍称这一款机器人通过数千次的加以指导的自我对决进行训练,并称该机器人已经击败了数个 Dota 2 的职业玩家。Brockman 在博客中称:“过去几周内,我们的机器人已经战胜过包括 SumaiL(世界顶级 1v1 选手)及 Arteezy(世界顶级 overall 选手)等多个顶级玩家”。

“自我对决”的理念是 OpenAI 研发的关键。这是一种 AI 系统学习解决极其复杂任务的有效方法:与太弱或太强的对手对战,它都无法从中学到东西,但自身反倒是有价值的对手。Brockman 介绍道:“你可以看到 AI 从完全的随机状态一步步发展到如今的顶级水平”。

OpenAI 并未打算就此停止征战的脚步。他们希望在明年的参与正式的五对五比赛。与此同时他们也对外发布了此机器人,所以任何人有兴趣均可与之对战。 第一个击败此机器人的玩家则可获得 Valve 专设的赏金。

我们创造了在 Dota2 1v1 比赛中能够击败世界顶尖职业选手的 AI。其完全是用 self-play 的方式训练,没有使用模仿学习(imitation learning)或树搜索。这对构建在混乱、包含人类行为在内的复杂场景下能够完成 well-defined goals 的 AI 系统 是重要一步。

Dota 1v1 是含有隐藏信息的复杂游戏。代理需要学习计划、进攻、花招以及误导对手。选手技巧和手速(每分钟动作)的关联不那么强烈,实际上,我们的 AI “手速”只是一般人类选手的水平。想要在 Dota 中取胜,要求选手培养出对对手的直觉,并采取相应的策略。在上述视频中,你能看到,我们的机器人已经通过完全的 self-play 学会了预测其他选手的动作,并在不熟悉的场景下即兴发挥,以及如何作用于选手的单位。

Dota 的规则非常复杂,如果是用规则方法,那么构建出的 AI 一定是个蹩脚的 player。所以,我们完全采用的是自我游戏(self-play)的训练方法。刚开始训练时,AI 对于自己所处的世界全无认识,而只是和自己的 copy 比赛,这也就意味着它和它的对手永远是旗鼓相当的。它用这个方法一点点地提升,直到达到了世界上最优秀的职业运动员的水平。The International (TI)是 Dota 的世界锦标赛,吸引了世界各地 20000名观众来观看职业运动员争夺2400万奖金。在 TI 上,我们派出 AI 和其中的多位高手进行了比赛,在比赛中,AI 展现出了很强的鲁棒性和技巧,许多职业选手希望能持续和我们的 AI 比赛,并考虑要把它当做是一种训练手段。返回搜狐,查看更多

责任编辑:

声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
阅读 ()
投诉
免费获取