>科技>>正文

人工智能+语音识别+教育 能擦出怎样的火花?

原标题:人工智能+语音识别+教育 能擦出怎样的火花?

[ ]

【IT168 评论】在数字化转型时代,云已成为万物智能的数字化大脑。而随着大数据应用、人工智能、移动互联网等技术的飞速发展,“智慧+”的概念正在深入到各行各业,提升企业效率,释放商业潜能,创造全新机遇。

作为国内顶级技术盛会之一,2017中国系统架构师大会(SACC2017)将于10月19-21日在北京新云南皇冠假日酒店震撼来袭。今年,大会以“云智未来”为主题,云集国内外顶级专家,围绕云计算、人工智能、大数据、移动互联网、产业应用等热点领域展开技术探讨与交流。

本届大会共设置2大主会场,18个技术专场,邀请来自互联网、金融、制造业、电商等多个领域,100余位技术专家及行业领袖来分享他们的经验,并将吸引4000+人次的系统运维、架构师及IT决策人士参会,为他们提供最具价值的交流平台。近日,笔者有幸采访到了先声教育联合创始人兼CTO秦龙,听秦龙老师跟我们讲讲人工智能+语音识别+教育的那些事儿。

▲先声教育联合创始人兼CTO 秦龙

秦龙,先声教育联合创始人兼CTO,卡内基梅隆大学(Carnegie Mellon University)计算机博士。秦龙老师在中国科学技术大学开始的求学之路,在大学3年级的时候,加入了讯飞语音实验室,是实验室的早期成员,师从语音届泰斗——王仁华教授。在科大毕业后,秦龙来到了CMU,从事语音识别方面的研究工作,是李开复老师的正牌师弟。秦龙老师希望通过人工智能技术解决中国教育资源匮乏、分布不平衡的问题。

云计算+人工智能 一定是未来的发展方向

第九届中国系统架构师大会以“云智未来”为主题,秦龙老师认为“云智未来”这一主题非常的好,把握现在,放眼未来。经过过去5-10年的发展,云计算技术,无论是底层的架构,还是上层的应用,都取得了长足进步。PC上无法继续的摩尔定律,在云计算上仍然有效。

而最近两年,从alpha go到德州扑克人机大战,更多的人体会到了人工智能技术的巨大进步。人工智能算法往往需要对海量数据进行处理,是建立在巨大的云计算能力的基础上的。而伴随着人工智能技术的进一步成熟,越来越多的人工智能技术也会以云计算的形式对外开放提供服务。所以说,云计算和人工智能的相辅相成,一定是未来的发展方向。

秦龙老师进一步补充说道:过去5-10年是互联网和移动互联网的时代,未来10年,甚至更久的时间将是人工智能的时代。更有人说,人工智能技术将引领人类新一次的工业革命。我觉得这种说法也不无道理。在人类历史上,每一次科技的变革,都引发了工业的革新,而这其中重要的一点就是技术进步对于生产效率的提升。

今天,人工智能技术已经成功的应用到很多场景中,例如安防、金融、教育等领域,极大的降低了人工成本,实现了很多过去无法大规模应用的服务。伴随着人工智能技术的飞速进步,我们的生活将发生翻天覆地的变化,自动驾驶汽车、智能诊断、AI老师、虚拟助手,那些科幻电影里面的画面将变为现实。

AI+语音识别+教育 能擦出怎样的火花?

据秦龙老师介绍,先声教育可提供国际领先的智能语音测评和智能写作批改技术服务。具体的说,我们向客户提供支持不同开发环境的SDK,包括ios、android、web、server端,客户通过调用我们SDK接口,进行语音或者写作的测评。先声教育的研发团队主要来自于卡内基梅隆大学、爱丁堡大学、清华大学、中国科学技术大学等国内外名校,团队在语音识别、语音评测、自然语言处理等技术上有超过10多年的积累。

我们的SDK支持离线调用和在线调用两种方式。SDK具有占用资源少,延迟小的特点。当用户的设备无法连接网络时,自动切换到离线调用,不影响用户体验。

那么,人工智能与教育如何深度结合?秦龙表示,先声教育的语音测评技术,不仅能满足简单的跟读、重读单词、句子、篇章的测评,我们的技术更是应用到中高考英语口语考试中。为了满足中高考的要求,我们在语音识别、语音评测、自然语言处理技术上做了很大的投资,实现了对中高考全部题型的支持,包括篇章朗读题、问答题和口语作文题的智能打分。

我们就先声教育的语音测评和写作批改技术,与国内相关的技术厂商进行对比,在相同的数据集上,先声的测评和批改技术较其他厂商在准确性上有超过10%的优势。同时,我们的语音测评技术除了支持英语和中文外,还支持包括西班牙语、法语、德语、意大利语等在内的10多种语言。

对于学生而言,测评不是终点,通过学习提高知识水平才是最终目的。为了帮助学生达到这样的目标,我们的口语测评和写作批改技术,在提供准确的打分的同时,还会提供非常详尽的问题反馈,使学生从错误中得到成长。具体的说,针对口语测评,我们既提供整个句子或者是篇章的总体打分,包括具体的完整度、流利度、准确度在内的每个维度的分数。

我们也提供小到音素级别的音素发音分、音素检错信息,单词发音分、单词重音检错,句子语调、语速信息等。在作文批改的反馈中,我们会给出作文的整体打分,我们也会检测学生作文是否跑题。与此同时,针对学生冠词、介词使用是否正确,人称、单复数等问题,用词造句是否符合英语使用习惯,也会给出相应的问题反馈。通过我们反馈的信息,学生可以第一时间发现自己的问题,从而以最高的效率提升自身的水平。

谈到目前语音识别的难点时,秦龙表示,中英文混杂并不能算是语音识别技术的一个难点,只是过去我们关注的比较少一些。为了解决这一问题,一方面我们需要大量的中英文混杂的训练数据,目前,这方面的数据还比较缺失。另外一方面,我们也可以尝试混合中英文音素建模,或者是中英文音素共用模型等方法。相比于算法,我觉得数据的问题更大一些。

目前语音识别的难点之一实际上是对于噪音信号处理的问题。比如说语音识别技术在噪音嘈杂或者是麦克风离得比较远的时候,效果要差很多,这一问题被称为语音识别的鲁棒性问题。深度学习技术的应用对于鲁棒性问题有一定的改善,但仍然存在很大的发展空间。

谈到未来,秦龙表示,从实际出发,人工智能技术在教育领域,短期内还很难完全取代老师做为一个独立的AI老师的存在。因此,先声教育的主要方向是以人工智能技术如何更好的辅助老师的工作,提高老师的工作效率为基础的。

目前我们所主攻的方向,语音评测,写作批改,以及自适应学习技术,都是需要占用老师大量的时间和精力才能完成的任务。比如说,如果一个英语老师负责两个班级,每个班30个学生,每个学生每天要完成10分钟的口语作业,那么一个老师一天就要检查100个小时的口语作业录音。这么多的录音,老师只能抽查很小一部分,平均到每个学生身上也就1-2分钟的时间,同时,老师也很难给每个学生个性化精确的指导。

先声教育口语评测技术可以帮助老师完成口语作业的检查,可以为每个学生提供个性化的发音指导,老师只需要根据学生的完成情况督促学生改进或者进行更多的练习。我们未来技术的发展,也是以对于教育场景的深刻理解为基础,通过人工智能技术来帮助老师更好的进行教学为发展目标的。

写在最后,秦龙老师透露,在即将到来的SACC 2017架构师大会上,我将在本次大会的语音识别技术分场介绍人工智能技术在教育领域的应用和前景。人工智能技术,包括语音识别、自然语言处理、语音分析和理解、情感计算、图像识别等技术,在教育领域有着非常大的应用前景,并且,一些技术已经成功落地。我将介绍,目前哪些技术在哪些场景下是如何融入日常的教学中的。同时,也会展望,未来人工智能技术不断发展成熟的条件下,教育将会如何发展。

▲2017年10月19日,让我们相约在北京,相约在SACC2017!

关于更多大会信息,敬请关注:http://sacc.it168.com/返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
投诉
免费获取
今日推荐