>科技>>正文

新智元327技术峰会人工智能创业家梦想秀:山世光、汪冠春、周曦演讲实录(PPT)

原标题:新智元327技术峰会人工智能创业家梦想秀:山世光、汪冠春、周曦演讲实录(PPT)

新智元327技术峰会

【新智元导读】2017年3月27日举行的新智元人工智能创业家颁奖盛典上,中科视拓创始人山世光、助理来也 CEO 王冠春、云从科技 CEO 周曦作为新智元2016年年度创业家,在大会上分享了自己的创业感悟和对人工智能的愿景。

创业家梦想秀PPT下载:https://pan.baidu.com/s/1c2xNTSG

山世光:Seeta:知人知面辨万物,开源赋能共发展

山世光:大家好,感谢新智元给我这样一个机会来跟各位分享。

我本人实际是从去年半路出家,从学术界跨出大半步来到工业界的。去年8月,我创立了中科视拓(北京)科技有限公司,Seeta意思是“See它”,这是个中西合璧的名字。我们希望能够赋予AI智慧的眼睛。

中科视拓是一家专注于计算机视觉领域的公司,具体来说,在AI大的赛道里面做图像和视频处理、分析与理解方向。最近有一个说法,天天宣传自己是人工智能公司的公司,其实都没有真的在做人工智能。我也不喜欢说自己是做人工智能的公司,我们更喜欢说自己是做计算机视觉的公司。

我们自赋的使命是给AI智慧的眼睛。这一点,对我个人来说是一个梦想,我自己做计算机视觉方向已经有20年。我坚信,人类社会一定会进入智能时代,智能将无处不在。而不管AI是以什么样的形态出现,长得像人还是不像人或者藏在某些什么地方,很大概率它都需要有一双眼睛可以去看这个世界,可以去看人。我们希望能够朝着这个方向去做这件事情。

首先说说我们是从哪里来的。我们来自中科院计算所,相信大家都不陌生,就是诞生了联想和曙光的那个研究所,我们所有非常好的创业理念,领导们对创业非常支持。具体说,我们这个团队起源于中科院计算所的智能信息处理重点实验室。再具体说,是这个实验室中的视觉信息处理与学习研究组,这个研究组的团队目前有六七十人,其中研究员、副研究员、助理研究员等老科研人员有20多位,硕博士研究生有50多名。过去20年来,我们从事的一直在从事计算机视觉与机器学习相关的工作,除了相关领域的基础理论方法研究之外,应用层面的研究也非常广泛,包括人脸识别、行人检测与再识别、车辆检测与跟踪、情绪识别、物体识别、商品检索、社会事件识别等等。

在这些领域,我们取得了非常丰富的学术成果,包括国家自然科学奖二等奖、国家科技进步奖二等奖以及国内外诸多竞赛的冠亚军等等。基于过去近20年的成果积累,我们去年8月成立了这家计算所参股的初创公司。除了我自己,公司创始团队大多也都是从计算所出来的,像CEO刘昕,以及另外几个博士生。公司的首席科学家是陈熙霖副所长,我们的科学顾问是高文院士,另外还有两位著名的技术顾问,即余凯和华刚。余凯同时还是我们的天使投资人,给了我们非常多的鼓励和支持。

下面,我重点介绍一下我们公司的“能”和“道”,即我们有能力做什么事,以及怎么去做。

首先,“视拓之能”何在?我们中科视拓的能力是什么?一言以蔽之,知人识面辨万物。所谓“知人识面”,就是我们有技术能力让机器去看人、看脸、看手势、看人像,知道它看到的是谁,是男是女,多大岁数,什么情绪,甚至猜测他在想什么,健康状况如何等等。

而辨万物则是可以实现对更多物体的检测与识别,包括自行车、摩托车、轿车等各种车辆,以及正在研发的对各种常用物品和大千万物的辨识,甚至动植物和各种医疗图像。简单说,我们希望赋予机器像人一样、并逐步超越人的“看”的能力。不难想象,这些技术的应用空间极其巨大,仅就人脸识别来说,就可以应用于安防、金融、交通等大量需要进行人的身份核验和识别的场景。当然,实现这些能力的背后是公司研发团队在计算机视觉、机器学习特别是深度学习领域十多年来坚持不懈的耕耘,我们的团队不仅仅会应用深度学习,还提出了小数据条件下的深度学习方法基于脏乱差大数据的深度学习方法微尺度卷积神经网络等新的模型和方法,同时辅以团队多年来积累的千万量级视觉大数据,使得我们具备了解决这些问题的能力。

接下来说说“视拓之道”,即如何运用我们的能力实现我们的使命。理想很丰满,现实很骨感。在我们进入工业界之前,已经有几家非常优秀的公司在计算机视觉这个领域做了大量尝试。我们能做什么?我们怎么去做?今天新智元大会的主题是开源和生态,这与我们的道路非常契合,我们的道路是“开源赋能共发展”。与其他已有的商业模式不同,我们决定走一条“开源+订制”的道路,在去年公司成立之后不久,我们就开源了一套完整、独立的人脸识别引擎SeetaFace,虽然SeetaFace说不上是一个最好的引擎,但是相比已有的开源人脸识别引擎,SeetaFace的性能好了很多,可以供大家完全免费的使用,而且接口简单不依赖于任何第三方的函数库。开源以来,SeetaFace已经在Github获得了1400多颗星的关注度。

开源之外,我们还愿意“赋能”,即把我们研发上述技术的能力输出给我们的企业客户。基于这样的理念,我们不满足于仅仅是把引擎和实现这些引擎的源码提供给客户使用的商业模式,我们进一步开放思想,乐意与企业客户做深度的合作,在合作过程中帮助客户提升自己团队的AI能力,甚至可以帮助客户从头组建一个AI团队。基于这样的理念,我们与华为深度合作,将我们的技术应用到华为系列手机中,创新性的实现了智能隐私的功能,同时也帮助华为提升了他们在深度学习方面的技术研发能力。

最后,我想跟大家分享一下我对于AI进展的认识。大家在过去几年时间里已经非常清晰认识到:AI=算法(或者模型)+数据+算力。我想跟大家探讨一个观点,就是这样一种模式能持续多久?是否会存在大数据深度学习的红利问题?我个人非常担心,将来有一天这样的红利会消失。也许目前在很多领域里,因为数据的积累还没有到深度模型可以承载的极限,大家只要努力做数据就可以做得越来越好。但是,我认为有一天,就算你搜集再多的数据,你的算法性能也未必能满足客户的需求,从而阻碍AI的应用部署。学术界和工业界的同仁们有必要一起去做前瞻性的探索和思考,当数据红利消失的时候,或者说大数据深度学习红利模式消失的时候,什么样的新技术可以解决大数据深度学习不能解决的问题?

刚才有新智元的记者问我对这次大会有什么期待。我非常期待技术专家们可以在下午有一些讨论,特别是大数据深度学习模式的局限性问题。我个人认为大数据深度学习是一种归纳法,主要适合解决经验性的问题。但是人类的学习除了归纳之外还有演绎法,我们需要去思考如何让机器获得演绎推理的能力,这方面值得我们关注。这是我想分享的第一个观点。

第二个观点,结合今天大会的主题,开源、生态。我想起在消防界有一个概念叫“火旋风”,如果我们在某个限定区域里有一些火点,可能每个火点都是非常小的火焰,但是如果火点的密度和气流情况达到某种理想状态,就可能形成一个非常大的像龙卷风一样的火焰,即所谓的火旋风。我想在AI领域,不管是学术界还是创业界的同仁们,我们每个人都是一个小火种,大家集合起来,合作共赢,一定可以形成一股人工智能的火旋风,最终实现我们每个人的AI理想。

谢谢大家!

汪冠春:用AI打造靠谱的助理产品

汪冠春:我想分享一下助理来也近两年来做智能助理的两点认知和三件在做的事情。

第一点认知是对话流是未来。

这里我想和大家分享个小故事。12年的时候,张一鸣曾经来找过还在做今晚看啥的我和一川,他说头条要用微博的方式做新闻。当时的我没有理解到最适合移动互联网内容类产品的形态就是feed流,所以没能预见到头条过去几年的飞速发展。快进到AI is the new mobile的今天,来也代表的助理产品其实就是用微信的方式做搜索,相信对话流会逐步成为AI时代最主流的产品形态

对话流可以重新组织获取信息和服务的交互流程,大幅提升体验和效率。举个简单的例子大家应该就能理解。10年前乔布斯推出第一代iPhone时,做过一个让全场尖叫的演示,具体过程是解锁iPhone,找到谷歌地图,搜索附近星巴克,点击拨打电话,和店员说要500杯拿铁送到会上。今天要做到这点,你只需要和小来说一句“500杯拿铁到会场”就能搞定,因为小来能理解你说的是咖啡外卖的意图,解析出了你要的具体数量和咖啡品类,通过你的日程又知道会场的具体位置,同时还对接了线下的小哥。

第二点认知是微信就是智能手机时代的浏览器,是最接近操作系统的超级app

我也认可智能助理的全面爆发可能要等到智能硬件生态完全成熟可以代替智能手机,但是垂直领域的助理类产品在接下来2-3年的时间里要实现规模化用户和规模化收入,机会应该就在微信。今天很多用户已经不在愿意下载各种app,对于创业公司用户获取也变得很贵,而微信的日活用户依旧保持着20-30%的环比增长速度。尤其是小程序的推出和逐步成熟,对于新品牌和公众号开发者来说会孕育不少新的机会。

来也在专注做的是以下三件事情:

1)让小来会成为微信中最靠谱的助理,记住一切和你相关的事情,比如亲友生日,客户联系方式,日程安排,常用地址,咖啡口味偏好,航空公司和值机偏好等等。同时小来能像最优秀的秘书那样帮你高效地搞定各项服务。目前因为小来,已经有数百万用户成为了有助理的人,“助理来也”也成了专业人士和都市新贵们在微信中置顶率最高的服务号之一。

2)让AI技术真正从识别走到理解,从理解走向交互和决策。今天我们在几个特定领域中都建立了完备的知识库并积累了数百万高质量的会话语料,而且产品每天还在产出更多的数据,这就允许我们尝试更深度的算法模型来提高精度,比如用深度学习来做意图识别和实体抽取,用循环神经网络在用户发起需求时生成候选动作,用类似AlphaGo下围棋的深度强化学习算法来解决对话中状态跟踪和策略优化的问题。我们认为虽然开放域的自然语言理解和对话是很难的,但在特定场景下做到99%可靠是可行的。尤其是AI和HI,也就是human intelligence真人智能,能无缝融合的话。

3)把来也的AI技术和系统以及做助理产品的经验输出出去。让各行各业的专业角色,无论是旅行规划师,美妆顾问,私人教师都能在来也的辅助下实现在线化和AI化。今天其实已经有很多行业领头羊,在微信等平台上拥有了数百万的用户,有着过亿的月收入,来也是可以辅助他们把价值释放得更快更大!就像只有夯实地竖起一根根立柱,才能建造出神庙,来也会努力在更多领域中让AI助理产品变得可靠和好用,一步步向更万能的小来逼近。

周曦:云从科技人工智能产业化之路探索

周曦:非常高兴今天能在这儿和各位分享一下云从的经验。先介绍一下云从,我们是一个人工智能公司。创业以来,我最大的体会就是幸运,国家和中科院都非常支持我们。

首先,现在国家发改委定了四个人工智能基础平台:百度、腾讯、科大讯飞和云从。我们非常有幸能够跟几大巨头站在一起,希望不辜负国家的希望。除了国家以外,中科院对于云从也大力支持。在过去的这两年里,云从基本是一个中科院技术公司,前后拿过7个世界冠军。

云从目前是银行业的第一大供应商,包含中国农业银行、中国银行、中国建设银行等约四五十家银行。

2016年开始,云从涉足公安领域,目前已经应用于22个省的公安。今天想与各位简单分享一下我们的体会。

从2015年成立,云从只做一件事情——将智能集中于一个非常明确的场景,并从头到尾做好。目前,人工智能技术有几个特点:一,处于快速发展阶段;二,还不够完美,在任何场景里都不够好,所以一定要定制。因此,如果我们只是做技术提供商,然后将技术交给其他公司,那么用户体验一定不好。因此,我的逻辑就是一定要全面,覆盖核心技术和产品,覆盖产品和行业解决方案,并一直延伸到售后服务,这样才能有好的客户体验。客户不愿意买单的原因是什么?我觉得没有其他的原因,一定是因为我们的产品服务做的不够好。

那么,我们应该先做什么?既然现在的产品还需要定制,还需要服务,那么生产消费级产品比较困难。因为消费级产品需要使用方便,不能有任何定制。任何一个智能手机,如果你买了得看说明书,就会觉得是垃圾产品。但是,我们人工智能(人脸识别)的产品只达得到目前这个水平。我们能做的事情非常有限的,因此需要有重视产品体验和服务的大V客户,包含金融客户。银行非常愿意你给他定制,还要求出厂,我觉得这是当前人脸识别的发展趋势。

作为创业公司,我们肯定希望产品逐渐从定制化走到通用化。云从也在做这些尝试。我们的态度就是一定要把产品做好,只有把产品做好,用户才会去买单,我们才有赚钱的机会。

我举个例子——人证合一,即检查身份证和本人是不是一个人。这个技术可以应用的场景非常丰富,像机场、火车站、医保、边检、电信、学校、网吧等。但是,这些场景的使用方式不一样。

如果医保场景采用手持终端,我们的医护人员就要手持为病人服务。如果应用于网吧,需要一个朝向里面的工作人员的单屏柜面。如果应用于酒店,需要双屏一体,一面朝向工作人员,另一面朝向客户,这样酒店可以集成想发布的信息。

如果应用于火车站,需要闸机和集成人、证、票三合一认证。若应用于电信、车管所、银行,产品可以变成高拍仪。所以这个技术所蕴含的产品形态和行业解决方案都是完全不同的。这对于云从来是一个挑战。我们的经验就是不会简单沉迷于我拿过多少冠军,客户关心的是你帮他解决了什么问题。因此它就需要各种各样不同形态的设备。

我觉得人工智能走到今天这一步没有捷径可以走,没有通用的AI技术可以做,我们能做的就是深入场景,深入到每一个解决方案。做出客户想要的东西,客户一定会给我们想要的回报。谢谢大家!

3月27日,新智元开源·生态AI技术峰会暨新智元2017创业大赛颁奖盛典隆重召开,包括“BAT”在内的中国主流 AI 公司、600多名行业精英齐聚,共同为2017中国人工智能的发展画上了浓墨重彩的一笔。

访问以下链接,回顾大会盛况:

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
投诉
免费获取
今日推荐