>科技>>正文

三角兽CEO-王卓然:一个Bot Maker的实践与思考

原标题:三角兽CEO-王卓然:一个Bot Maker的实践与思考

王卓然,三角兽科技创始人、CEO,英国UCL博士,在智能交互、机器学习、垂直领域对话系统方面有十年经验,端对端多轮对话专家,2010年领导建立东芝第一代对话系统,前度秘中控决策负责人。

2016年2月三角兽科技成立,已经完成三轮融资,成为国内人工智能语义领域发展最快,拿融资最多的创业公司。

三角兽CEO王卓然出席了由葡萄创投主办的2017春季人工智能产业峰会,并做一个Bot Maker的实践与思考主题演讲。

以下为王卓然演讲实录:

一、 关于Bot Maker的思考

今天我报告的题目是一个Bot Maker的实践与思考。之前我相信大家在各种媒体,各种场合也看到,包括今天很多同行大家分享了很多很有价值的思考,今天其实我主要想分享一下我们的实践。

人们为什么需要人机对话

2015年初四大即时通信软件已经远超社交媒体软件。在这个即时通信最合适的一个出口形式是什么?人机对话。

人机对话的商业价值

人机对话它的商业价值到底是什么?这里分享另一个,我们说人机对话有两大应用场景,一个是复制人工,另一个是替代人工。我们先看这个辅助员工。根据行业左右用网络平台产生内容去创造收益的一个模式来讲,我们平均来讲有20%的收入是留在了网络平台,80%收入分给了人工的网络。如果我们借助人机对话,在这个行业里面强占哪怕1%,对我们总的收益的增长就是5%。

我们看世界五百强的企业它的PE是22倍,对于一个创业公司它的估值和收益比大概4:1,如果在这些公司上每减少1美金的人力成本得到的是4到22位的一个投资回报。从这个看,我们人机对话应用场景,我们商业的收益非常清晰。

人机对话的爆发点

为什么去年这个人机对话并没有爆发,或者说这么多年人机对话一直没有爆发?其实这是一个正常现象,我们来分析一下这些年我们这个行业经历了什么?对于任何一个新的科技它都会经历一个从科技的诞生,到被媒体和行业追捧到一个巅峰的时期,会有一个下滑,我们说的幻灭。然后大家开始思考反思这个应用场景到底什么?这个词很有意思,启蒙,最后再到实际商业化的展出。

对于人机对话这个行业,这条曲线是从哪开始的?我个人认为首先从深度学习开始,第一个收益是语音,语音识别从原来一直在学术也好,突然变成一个能真正应用的一个应用,于是这个人机对话真正的从学术界走到了应用变成了可能。第一个大家可能都知道出现了各种各样的语音助手,我记得所有手机上都有一个圈或者一个麦克风,但是不到一年这个语音助手下线了。

这是为什么呢?行业开始思考,甚至有人说语音助手不是一个命题,不是人工刚需。于是我们做了很多的尝试,比如我们有新的交互模式,从任务到聊天,到微软小冰,然后又有了聊天和服务结合的比如说度蜜(音),有的新的产品比如辅助人工聊天的,有新的平台,比如说Facebook,包括我们有微信,我们有了新的载体,不再是单一的手机,等等之类的产品。

二、 Bot Maker的核心

这里面核心的,我们做了这么多尝试之后,我们看到了我们有新的入口,我们也新的产品,我们捉到了一些新的模式,但是这里面缺了一个环节,大家想想是什么?是不是用户?我们怎么真正的去更好的服务用户?最核心的之一还是要提升我们这个人机对话的能力,让它更好的满足人的需求,怎么提升这个能力?

人机对话的商业价值

QUESTION:

人机对话现在最主要的瓶颈在哪?基于数据驱动的。跟语音图像不同的是什么?我们看一下人机对话这件事需要什么样的数据?

ANSWER:

1、语言的角度,我们把一个人类的语言分解成词,分解成词法,分解成句话,分解成语义,把一个自然语言一层一层包围结构化的抽象,抽象成一个机器人处理的一个表。

2、知识的角度,我们把互联网上海量的文档,这些数据又一层层的抽象,抽象到话题,抽象到知识,抽象到文体等等,抽象成结构化。这两层输入到系统里面,系统再去产生回复,然后得到资源等等。

重点:对话系统所需要的数据,它从最原始可获得的这种文档,或者说自然语言的句子开始,加工到高度结构化,信息的成本是蛮高的。我们可以想象这里面每一层都需要人工的参与,甚至越高维的需要的知识越重,导致传统的模型获取数据的成本是非常高的。

人机交互未来的发展

数据高度结构化

这是我们做的一个尝试,从轻结构化到去结构化过渡。什么是机器最擅长处理的?机器最擅长处理的是数字、矩阵之间的变化,而不是知识结构,像刘德华和朱丽倩之间的关系,机器能理解的就是堆数字。我们怎么做结构化这件事,我们现在还没有完全达到结构化的状态,结构化的东西当然还是要结构化处理。另外关于什么题材的电影,旁边这个例子可以讲一下,这个模糊的需求怎么办?其实深度学习我多说一个,深度学习给自然语言处理最大的一个帮助,我们把原来词和词之间,机器理解不了词和词之间的关系,有了深度学习,我们让词和词之间的距离可以缩短了。

这样的话,我把他一些信息向量化表示,去计算这个距离,这样我找到去满足你需求的实体,人并不知道怎么表示。旁边是另一个例子,这个是我们给客户做的一个工具,这是一个段子手的应用,你可以说结构化,你也可以非结构化的表示出来,计算这个距离。图片这种简单的当然还可以去计算。

决策

在这个域学到的策略,怎么应用到下一个域?这里面也是我们把对话,或者说计算机执行任务这件事做了一个高维的抽象,我们怎么描述一个问题?我们原来描述问题我要找餐馆,还是我要订票,我要打车等等。经过这个抽象对话解决的是什么?我要增加限制条件去检索一个实体,于是我找餐馆、电影,还是找音乐,这些事儿其实在对话逻辑上一样的。

某一个系统集成了多域,我要用哪个域去满足?我这个系统不断往里面添加几个域或者删除几个域,我怎么让多域选择这件事抽象的表达出来?正好有上一个图片,我可以用每一类的信息汇总,这个当初百度语音助手的时候我做的一个工作,后来度蜜(音)也有复用这部分框架。是我们在对话迁移方面的积累。

三、 Bot Maker的实践

针对这几块问题我们都做了什么呢?

上下文可感知

这是在聊天上下文上的一个尝试,本质是什么呢?我们又回到了最初的深度学习的逻辑。主要我们深度学习给自然语言带来最大的帮助,其实我们能表示多个句子。下面意思是我们把每个句子表示什么项量,这些项量之间再加一个上下文的表示,还有一个解决的数据输出。因为大家知道先主流的商务聊天都是检索作为基础,你作为单句去检索,因为一般我们会有百亿级,真正用上下文多个句子去检索,数据肯定是稀疏的。这样把它作为项量保持之后,我们解决了这个上下文稀疏的问题,这个是我们自己的一个小样,大家可以看到我们聊天的过程上下文很明确可以感知的。在上下文辅助的时候,可以把这个话题顺畅的进行下去。

改造循环神经网络

就是我们常说的IOSDM,神经元,我们把一些常识积累了,放到我们上下文当中去。我举个例子,比如我喜欢杨幂,这个时候她不光回答杨幂,她还会回答杨幂是演员,她会直接把话题转到杨幂相关的电影,或者相关的信息。这块还是我们研究的一个初步的成果,逐步我们会往成果上转化。

性格定制

下一步是更值得期待的一块,这是我们做的更大的一个迈进,之间我们说聊天,除了商业包装,或者一些简单的系统的属性之外,我们感觉到机器人还是带着机器人属性,它并没有一个完善独立的特征。这一块我们可以为聊天机器人做性格的定制,这也是我们给甲方打造的产品。

综上,其实是我们在这个行业做的一些积累和分享,希望对同行们和广大的对这个行业关注的人们,有一个抛砖引玉的作用,借此机会也感谢我们的合作伙伴,这些合作伙伴是我们在他们的产品当中有提供技术的支持,也感谢他们让我能有机会把我们热爱的这个技术真正落地到产品上,输出给大家。

点击大咖名字,查看精彩葡萄干货

丨...返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
投诉
免费获取
今日搜狐热点
今日推荐