>科技>>正文

喜提 NIPS 挑战赛冠军的百度,还有更多“AI Do”的野心

原标题:喜提 NIPS 挑战赛冠军的百度,还有更多“AI Do”的野心

一年一度的人工智能顶级峰会 NIPS(Conference and Workshop on Neural Information Processing Systems,中文译为:神经信息处理系统大会)即将在下月初正式召开,作为此次大会的八大挑战赛之一,AI for prosthetics Challenge(人工智能假肢挑战赛)上周已经决出胜负,来自全球 400 个技术团队参与了此次比赛,冠军被首次参赛的百度夺得,其 9980 分的高分,足足领先第二名高达 30 分之多。

据媒体报道,此次挑战赛是通过强化学习算法,来实现对人类骨骼仿真模型的训练,使模型能最大限度模仿人类运动方式,从而实现人工智能与生物科技的真正结合。

参赛的团队里,不仅包括上届冠军、由「强化学习之父」Juergen Schmidhuber 创立的 AISENSE,还有阿里巴巴、Yandex 等巨头,而首次参赛就得冠军的百度,在此次竞赛里不仅展示了自身强大的强化学习能力,也让外界看到了相关技术应用的无限可能。

那么,为什么这次比赛意义重大?百度能脱颖而出的秘诀又是什么?这些技术对于行业发展又意味着什么?

年度八大挑战赛之一,难度大含金量高

今年 6 月份,NIPS 组委会从 21 个与大会相关的人工智能竞赛中挑选出 8 个,包括利用对抗性生成网络的计算机视觉挑战赛、对话式智能挑战赛以及 AI for prosthetics Challenge(人工智能假肢挑战赛)等。

某种意义上说,这些比赛的内容体现了当年 NIPS 对于技术发展趋势的研判,同时比赛的优胜者将在 NIPS 上发表相关演讲,因此每一项比赛都吸引不同领域的公司、研究者参与其中。

而人工智能假肢挑战赛,由斯坦福大学神经生物实验室和 EPFL 联合主办,主要探索如何更好将强化学习算法应用到人体假肢之中。

据了解,此次主办方提供了一个基于斯坦福国家医学康复研究中心研发的 Opensim 高仿人体骨骼模型,这个模型拥有人类腿部绝大多数真实骨骼、关节和肌肉的精细仿真。参赛者需要根据该模型中多达 100 个以上的状态,来决定模型肌肉的信号,然后控制该模型的肌体行走。

在去年的第一次挑战赛上,比赛规则围绕谁能让模型肌体行走速度最快。而今年除了将整个模型运动控制从2D改为3D外,还引入带有假肢的模型,同时模型的假肢不可控制,模型肌体行走的速度也有要求,并且还需要在第二轮比赛中按照事先未知的指定速度进行切换。

上述规则进一步增加了比赛的难度,比如对模型肌体有效信息的判断上,由于实际状态空间和动作空间稠密并且非常大,导致基于强化学习的算法无法准确把握模型肌体的行走姿势;更进一步,由于规则要求不断切换速度,更增加了模型控制难度。

尽管难度较大,但自今年 7 月份比赛开始启动到现在,来自全球 400 多技术团队都参与其中。这场强化学习领域的「模拟考」竞争异常激烈,最后的得分榜上,第二名 NNAISENSE 和第三名 Jolly Roger 之间仅有 2 分之差,而第一名的百度,则以30 分的优势获得冠军。

在关注度如此之高、难度又如此之大的比赛中勇夺第一,百度不仅令业界看到了强化学习的能力积累,也在展现相关应用的可能性。

技术黑科技与无限的应用场景

正如上文所言,此次比赛的难度非常高,想要取得好成绩,除了要拥有基础的计算能力,还要在相关算法设计上做出创新。

以此次百度所采用的几项技术为例,首先,通过上千台机器的 CPU 集群来加速模拟环境,利用 RPC 机制进行机器间通信,从而能在高性能GPU上进行高效的模型训练。

其次,利用 Deterministic Policy Gradient (DDPG),使得模型能够应对较大空间和连续动作空间的挑战,最终也使得一个单一模型能够学习多种速度和姿态。

第三,在算法层面。通过 multi-head bootstrapping,能够更好应对模型肌体的连贯性行走,同时还将强化学习的旋转不变性等各类特征处理方式,以及不断实验累计的各类 reward shaping 方法应用其中。

正是上述关键技术的综合应用,从而让百度能以 9980 的高分一举夺冠,有参赛者表示,这是一个他们难以相信的分数。

事实上,这次挑战赛所展示出来的技术应用场景,并非仅仅局限在人体假肢这个领域。

强化学习作为一种与环境交互的机器学习方式,拥有非常多的应用领域。比如在机器人的场景里,机器人需要时刻与环境做出交互,它需要了解道路信息,躲开道路障碍等等。这些时刻变化的信息也会影响到机器人的行进速度,恰恰也是人工智能假肢挑战赛中所考察的能力,这也意味着,百度在此次比赛中的这些技术积累可以直接应用到对机器人的控制算法中。

另外,自动驾驶汽车也是一个需要和环境做交互的设备,那么是否能将上述技术应用到其中呢?

更进一步,强化学习所谈的「环境」,并不仅仅只是物理环境,它也可以是一种「虚拟环境」。举个简单的例子,当用户在搜索引擎里输入一个词开始搜索后,接下来他所关注的内容都和这个词有关,而他看到的这些内容,可能含有构成接下来继续搜索的关键词,以此类推,这也是一种不断与环境交互的模型,同样也可以是强化学习所发挥作用的地方。

上述几个场景,不管是自动驾驶还是信息流推荐,都是目前百度正在发力的方向。未来随着这些技术更深度地落地,整个产业也将再次为此震动。

与此同时,这种能力也会通过 PaddlePaddle 开源平台赋能更多开发者,据了解,基于 PaddlePaddle 的强化学习框架PARL将在今年四季度正式发布,届时将为更多深度学习领域开发者提供强而有力的技术支撑。

尾巴:「AI Do」可能才刚刚开始

刚刚结束的百度世界大会上,百度展示最近一年在人工智能领域的多项落地产品,涵盖自动驾驶、智能城市、对话式人工智能以及信息流等多个产品,而此次大会的口号也很有意思,「Yes, AI Do」。

所谓「Yes, AI Do」,更像是两个相互叠加的命题,一方面是对 AI 技术不断落地的承诺,另一方面也是 AI 技术继续创新的承诺。

从这个角度去看,百度在这场业界瞩目的 NIPS 挑战赛中折桂,并取得其他选手形容为「不可能」的高分,充分展现了百度在强化学习领域的技术创新,同时也为接下来丰富的场景应用埋下了伏笔。从技术创新的领先与场景落地的引领,百度的「AI Do」可能才刚刚开始,百度将会用不断创新的AI技术让未来充满无限想象。(完)返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
投诉
免费获取
今日搜狐热点
今日推荐