>科技>>正文

智研所|朗播贾艳明:都在提倡的双师模式,是有问题的。

原标题:智研所|朗播贾艳明:都在提倡的双师模式,是有问题的。

搜狐科技/宋婉心

过去一年,VIPKID完成D+轮5亿美元融资,作业帮完成3.5亿美元D轮融资,流利说于纽交所正式挂牌上市,新东方在线登陆港交所上市。仅仅在K12领域,2018年就有8例亿元级别以上的融资。

一个明显的趋势是,原本针对于学习外围环节的工具型APP,即工具型AI,开始向自适应智能学习系统过渡,标志着在线教育迭代进入新阶段,摆在行业面前的是一轮必然发生的科技对传统企业的改造革命。

在线教育领域内,朗播是一个被视为逆潮流的存在:从2007年成立之初,就坚持以教研为核心驱动标准化产品的落地,投入十余年构建优质的学习方式与内容素材,最终形成“朗播智能学习系统”。

在此基础之上,人工智能技术为学生提供个性化学习方案,并由大数据总结并预测学习路径。一套包含了完整“测-学-练”解决方案的线上产品便成为了朗播打通线上线下的“中央厨房”。

而近期,朗播也推动“教育新零售”战略,落地英语智能学习实验室到全国各大城市。从线上产品规模化扩张开始,逐渐渗透至线下,步步为营布局全国的教育科技企业有着怎样的秘密武器?搜狐科技“智研所”沙龙第4期邀请到了朗播首席科学家贾艳明进行演讲,以下是其演讲精编:

今天我主要分享的是AI+大数据落地语言学习的实践,分三方面内容:AI在教育的应用、朗播的实践、AI在未来教育场景中的展望。

人工智能到底跟教育是什么关系?大家都在谈教育,但是很少有人想过教育是什么东西。教育是以知识为工具让人们学会思考的过程,它包括知识传递,和吸收内化成能力从而解决问题两个方面。我们认为的学习是什么样的?大家挤在一个教室里面听老师讲课,人多的时候挤不下也硬往里塞。我初中的时候50多个人的教室里面塞了80多个人,教育资源缺乏。随着互联网的发展有了在线直播,一个人在上面讲,几百人几千人甚至几万人,不受空间时间限制,只要有人讲,学生就能听。这样是不是解决了教育的很多问题?解决了一些小问题,但是总的来说效率比较低,效果比较差。刚才我们也提到,教育最后的目的是为了让人真正提高能力去解决问题,但这两个都解决的是知识传递问题,讲完之后就不管了,到底这个学生学会没有,学的怎么样?解决不了这个问题。

AI是不是能解决一些问题?最早出现的就是拍照搜题,哪里不会拍哪里。后来在传统的教室里面装上摄像头还有录音设备,搜集到表情,学生到底听的怎么样,是不是听会了或者不会,有一些表情出来。还有陪伴机器人,跟孩子交流,看跟机器学到什么。

这些都没有触及到教育的本质。

AI+教育真正重要的是什么?第一,教研。我们在没有AI、没有互联网之前也有很多教育公司是很成功的,也就是说,没有这些技术,依靠优秀的教研能力也是可以作出优秀的教育产品;但如果只有技术没有教研的话肯定做不了一个伟大的教育公司,所以教研是根本。

第二,技术+数据。更重要的应该说是数据,技术只是个工具,而且随着开源工具的发展,只要我们来了一些数据,用各种工具就能够搞出来一些模型,帮助大家解决很多问题。

所以,教研、数据这两点是最重要的。

AI在朗播的实践。朗播成立于07年,是国内最早提供标准化英语学习解决方案为核心的教育科技公司。我们现在主要有两块业务,线上To C和教育新零售。线上To C是通过在线的标准化的英语智能学习系统,给学生提供从出国留学、四六级考试还有通用品类考试的标准化产品。教育新零售是我们在去年下半年开展的新的业务,主要考虑到现在的学习系统不是最大的问题,最大的问题是学生不爱学习,另外就是教育资源不均衡。因此开展了教育新零售业务,在各地都可以建立智能英语学习实验室,充分利用人工智能技术为英语学习者打造线上标准化学习+线下标准化监督辅导服务的新型智能学习模式。

朗播跟其它机构区别非常大,朗播不是大家以为的培训机构,而是输出标准化的产品。我们在生活中应用和实践,或者在考试的时候最终能够体现你英语水平的都是能力的提升,而不是说你刷刷题就完事了,刷题的品质是不可控的,有人会刷就刷好了,有人不会刷就刷不好。

为什么要标准化?标准化的目的就是量化,从而达到质量可控。比如我们把听力量化成准确辩音、音译匹配、听能逻辑。我们以前问,同学,你听力怎么样?一般。还行。还行代表什么意思?他回答不上来。我们有了量化标准化以后,能回答出来,到底没听到,还是听到之后在脑子里面没有找到这个词,如果没有找到这个词或者句子就是音义匹配的问题,找到之后这两个都解决了,听能逻辑是不是好?中国人说话互相对话时你问我一句话,你可能还没问我就能够预判出来你下句会说什么。在英文当中如果前两个能力达到了,根据语境能够判断出来下一句说什么,这就是听能逻辑。我们把学生学英语的整个能力标准建立起来,在这个基础之上,利用AI和大数据技术,提供个性化的学习平台。

在我们的自适应系统里面基于语音识别和自然语言的判分模型只是一个最基本的引擎,真正大的框架是数据驱动的自适应学习模型。真实系统比这个要复杂很多,简化一下,把自适应学习过程分为几部分。第一,测,需要知道学生哪里不会,到底差多少。第二,测完会有学习路径规划的系统,相当老师的作用,相当于老师指出来你应该学什么、怎么学。第三,练。我们知道你的问题,按照现在的情况以及目标给你排出来训练的计划,有一个知识追踪过程,判断你到底掌握没有。如果掌握了的话就继续往前走,没掌握的话继续练,直到达到你的学习目标。

抽几个模型给大家讲一下,我们内部有一个特别准的测评模型,2个多小时,有一些环节2小时有点长,学生做起来心理压力大一点。我们开发了快速的测评模型,原理也是贝叶斯的方法,我们在线下会把能力点对分数贡献更大的题目选出来,学生只做这些题,再根据线下的统计,就能够给这个学生估出来能力大概是怎么样。十几个题就能够估出来你的基本水平范围,如果要进一步再测的话,可以做190多道题的完全测评系统。

当我们测完之后相当于知道水平差在哪儿,这时候进行个性化的学习路径推荐,其中一个引擎是贝叶斯网络。通过数据和专家的经验建立起来各个能力点以及分数之间的关系,就是一个条件概率,通过线下很多数据会把这些概率都算出来,当一个学生来了之后,他说我现在是怎么样的,通过测评得到什么结果,我想考到什么目标。这些信息全部输进去,这个模型就会做一个推断,推断出来这个学生其它能力,可能是什么样的。这时候我们根据这个模型推断出来一个更适合于他短期内能够达到他目标的这样一条路径。

给他设定好将来要怎么学习,学习的时候怎么叫学会?有一个知识追踪模型。根据学生的答题序列推断出知识点是否掌握,能力是否提高,是这么一个作用。传统的方法是贝叶斯方法,侧重于某一个知识点下用这个方法去做。深度学习的模型,现在用的比较多一点,但是要求数据量比较大。法,侧重于某一个知识点下用这个方法去做。深度学习的模型,现在用的比较多一点,但是要求数据量比较大。

我们用的是贝叶斯深度学习,网络上的每个节点原来是一个参数一个点,我们把它表示成一个分布。传统的方法相当于我们通过数据得到一个点模型,再通过点模型去推断新来学生的情况。而如果用这种分布的话相当于我们把原来学生所有的情况都记到这个分布,再用这个分布推断新来的学生学会没有。这样的好处在于数据少的情况下,也用这个方法也能推断。这时候模型更准,可以考虑到所有人的情况。这块我们已经申请了专利,别人还没做过这样的事情。

朗播语言学习体系包括如下几部分:第一,我们有方法课,做知识传递。第二,自适应学习系统,吸收内化成能力。第三,辅导课,帮助学生吸收内化。AI引擎是基础,用在自适应学习系统中,测评、教学、练习当中有各种各样的模型,这些模型今天只是介绍了很少,还有很多模型都在用。教研以前全靠老师,现在发现老师的精力有限,他看不过来很多学生,即便20多年经验的老师也不会一个一个去看,但是数据能解决这个问题。最常见的一个例子,学生经常把主语从句和定语从句分不开,之前并没有这个发现,通过数据发现,当然数据化教研还做了很多工作。

接下来为大家分享下朗播AI学习助理。

现在大家经常听说双师模式,线上一个老师,线下一个老师。但是线上老师和线下老师教学理念或者想法不一样,所以这块是有问题的。朗播英语智能学习实验室就是能解决这个问题的,线上有一套标准化的学习系统,并且把学习的数据全部记录下来,线下有标准化的督学服务,解决了线上线下不一致的问题。并且通过AI学习助理,让学习过程和学习质量的管控更加标准化。通过数据帮助助教找出来到底哪是你的问题,让助教拿着报告跟学生说,你哪块有问题,应该怎么做。这块是因为线下助教有时候由于能力不一样,或者跟心情不同,给出的辅导有差异,他今天心情好判分数就可能手松一点,心情不好就可能手紧一点。而AI学习助理是客观的、稳定的,因为它依赖的是客观的数据。

AI在未来教育场景中的展望,标准化是个性化的基础,刚才讲到,标准化才能量化,量化才能衡量出来每个人的不同,所以他的学习才是个性化的。第二,教育新零售利用大数据和人工智能打通线上线下隔阂,将是更有效的学习方式。现在学生的学习不是说各家开发系统不好,而是他不愿意学,更多需要老师来督促一下或者有其它学生陪伴一下才能学习更好。教育新零售开了线下实验室,给大家提供一个学习方式,这样让你充分利用人工智能以及人类的智能,充分利用各自的优势解决一些问题。这样没有人再有理由说学不好。

人工智能不能取代教师,教育是有温度的,学生做题也有心情不好不想学的时候,老师这时候应该给他心理上一些辅导,好好疏导一下,老师的作用还是非常大的。将来教师的角色是否发生变化?很顶级的老师会继续做知识传授,做方法课,帮我们做标准化的产品。还有一部分老师转化成互联网产品经理,他们是教育方面的专家,学计算机的可能不懂,利用多年的经验可以设计出来适合学生学习更好的产品,做系统设计。另外一部分老师做个性化的辅导,如果线上有一些问题解决不了,线下简单辅导,有些技能需要更多实践,也可以进行个性化辅导。

我们07年开始做在线教育,一直在搜集数据,技术只是工具,在数据基础上我们才能够做很多事情。所以说,自适应技术的核心是数据,因为有了数据,我们才能在这个基础上去建立比如对于我们来讲是一个语言学习的模型。有了这个模型,我们才能做自适应模型,学生来了之后跟我们的自适应学习系统学习,模型根据数据再迭代,这样逐渐模型越来越准,学生自适应的过程也会越来越顺畅。数据是核心的东西,包括学生的数据,加上教研的数据都在里面,这个是最重要的。

数据获取方面,对于K12领域来说,其实像中国现在还是以学校教育为主的传统教育,学校愿意接受这样一个新的理念,愿意把新的数据化的、数字化的理念灌输进去的话,在学生上课的环节或者课下各种环节都可以搜集到,包括学生的兴趣、知识点或者性格,我们有这些东西之后才能做一些个性化的东西。这是K12的情况。其它领域,在线教育能解决,在线上所有东西都数字化了,数据化数字化以后,学生在网站或者在APP上留下的每个痕迹都能查得到,这样数据确实能够拿到。像朗播就是一直通过在线教育的方式积累了很多数据的。

返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
投诉
免费获取
今日搜狐热点
今日推荐