英语流利说林晖:借助人工智能来赋能英语教育的道与术
2018年1月18日,“NextWorld新生态未来峰会”在北京召开,本次会议邀请了当下最热门的创业风口和投资领域的意见领袖,以思想的共鸣引领变革方向,在这个不断变革、快速迭代的商业时代下,讨论如何抓住机会、如何把握未来。分享2017积攒的经验,斟酌2018预见的趋势,从人工智能、移动应用、新媒体、小 程序 四大领域总结当下,共谋未来!
会议上, 英语流利说 联合创始人 林晖 做了精彩演讲。
以下为演讲实录,经投资界(ID:pedaily2012)编辑整理:
林晖: 谢谢 主持人。大家好!很高兴跟大家有机会来分享关于人工智能和在线教育的思考。自我介绍一下,我叫林晖,英语流利说联合创始人和首席科学家。我相信大家对在线教育这个话题应该都不陌生。其实在线教育最早是叫远程教育,这个概念是在十几年前就被提出来的。那个时候由于互联网的技术还是有限的,教学的方式也受到了限制,但是核心的思想是什么?就是利用这种互联网的技术来解决教育的一些空间上限制。
大概是在2012年、2013年的时候出现了“慕课”,做在线的慕课,但是因为录播的形式互动比较少,学生很难坚持下去,课程比较低。到今天最近这两年非常火的在线一对一教育,也进入到了大家的视野里。这里面一个典型的代表是K12的少儿英语教育,通过在线真人外教一对一教学打所谓的个性化教学,把在线教育推到了一个新的高度。
最近,我也让我们家小孩去试了一下当下比较火的少儿英语,在线英语教育。我陪他上了几节课以后,其实发现虽然说是个性化教学、一对一教学,但是整个教学的过程是非常套路和流程化的。老师就是按照一定的流程讲下来,中间很少有非常个性化的互动,更不用说这种个性化的教学内容和编排。我最近也听到了身边不少的朋友反映,在线教育确实火,但是像这种火的在线教育产品,他们这些好的老师越来越难约到。比如说小孩请老师很难约,约不到,老师要经常换来换去。
其实后面的原因也不太理解。因为学生是多的,老师是少的,老师的时间是有限的,优秀的老师也是少的。没有办法一个老师专门教你们家的小孩,资源是不够分配的。也就是说,老师的时间是非常稀缺的资源,而优秀的老师又是一个非常稀缺的物种。现在所谓的在线教育、所谓的个性化教学,只是形式上的个性化,它本质上还是千人一面,并没有做到真正的个性化教学。所以我们需要有创新,我们需要有新的形态,新的生态,新的在线教育。
回顾历史,其实创新往往不一定是沿着原来曲线的轨迹出现,它可能是一个从新的曲线开始,而这个新的曲线起点又是一项新的技术出现。新的技术出现、新的形态出现,可能一开始和旧的形态比不是特别可比,甚至说看起来毫不相关。但是当新的形态起来了以后,它很可能把旧的形态远远抛在后面,甚至于说完全颠覆和替代。
今天来看,我们认为在在线教育行业,如果说中间的这一条曲线是传统的教育,第二条曲线是在线的教育。我们认为接下来会有第三条曲线,一个更好的曲线,一个更优的曲线,我们把它叫做智能的教育。
智能教育的起点也就是人工智能的技术。在第二条曲线上传统的在线教育,跟现在的在线教育,它没有解决根本的问题,解决的问题仅仅是所谓的生产关系,没有解决根本的生产力的问题。生产力的问题是什么?人类老师它是稀缺资源,人类老师是不可复制,要解决这个生产力的瓶颈,我们认为是需要借助人工智能的帮助,要实现真正普适和个性化的教学是需要人工智能的帮助。
接下来,跟大家分享一下怎么样在这条路径上,通过借助人工智能来赋能英语教育。我们要做的是一个教中国人学英语的AI老师,首先AI老师得有一个能力要听懂学生说了一些什么,听懂这件事情就是大家所熟悉的语音识别。之所以语音识别困难,因为是有很多不确定因素的影响,比如说环境的噪音和说话人的口音等等,但我们面临的问题叫做语言识别。也就是面向的对象语言掌握的程度参差不齐,语言掌握程度的参差不齐是额外的确定性,让事情变得更加的困难。
为了解决这样的问题,我们在产品上做了创新,通过落地产品,打造产品到数据再到人工智能的闭环。当我们的产品用了以后产生大量的数据,大量的数据能够来提升人工智能形成一个正向的反馈。到今天为止我们的英语流利说超过了6000万的用户,这些用户每天在APP上大概学习20到30天的时间,不断贡献大量的数据。到今天为止可能搜集了世界上最大的、带标注的,中国人说英语的语言数据库,利用这样的数据库在结合最新的深度学习技术,我们打造了世界上最能听懂中国人说英语的语音识别引擎。我们也做了一些测试,收集了4个测试题,把我们的语音识别引擎跟世界上所有开放的语音识别引擎对比,这里面包括了Google、Microsoft、国内 科大讯飞 等等等,在四个测试题上面,我们的识别引擎不管说话说英语水平是高是低,都比其他的识别引擎取得了更好的识别率。
基于这样的一个识别引擎,我们又打造了一个口语评测的引擎。口语衡量了几乎所有的维度,不光是发音,词汇、语法、流利性、连贯度等等都能做评分和反馈。从粒度大到篇章,小到音素都可以反馈。说到音素级别的反馈跟大家分享一个事,苹果的全球副总裁在两年前访问了我们的公司,我们公司是他当时访问国内唯一一家移动APP开放公司,他当时对我们的AI技术非常感兴趣,现场尝试了口语评测模型。Phil(菲尔)他是一个美国人,英语应该很标准,当时现场也没有准备,比较尴尬的是引擎并没有给他非常高的分数,而是告诉他说这个单词叫ARE单词发得不够好,当时气氛一度尴尬,空气大概凝固了几秒钟,后来Phil(菲尔)当时说你们引擎还是比较很好的,因为他说他是波士顿口音,波士顿口音是会把元音后面的R吞掉。这也显示了引擎的灵敏度。
我们的打分受到了行业的高度肯定,这张PPT跟大家分享的是Barry O’Sullivan教授,他在语言测试领域是一个非常顶尖的专家,是教授级别的作者。看了很多的技术以后,对于我们的打分技术给了一个非常高度的评价,他说就是过去二十年来自动评分里面出现的一个重大突破,我们的技术遥遥领先,对我们技术一个非常高度的评价。
如果说,语音识别、口语评测,它属于人工智能的感官听觉的部分,我们AI老师不但有感官,它还有认知和决策的能力,是能够懂学生、会教学生。我们打造了世界上首个基于深度学习的自适应学习系统。什么叫自适应学习?它就是根据学生当前的学习状况去自动的调整教学策略,学生的学习效果更好,做到真正的个性化教学。大家可以理解认为AI老师手上和下棋打牌很像。大脑决定当前你打出什么样的牌或者接下去打什么样的牌,对于学生的教学效果是最好的,其实一方面在估计预测学生的可能行为和知识状态,然后所有的自适应系统会根据这样的估计来做一定的策略。就像Alpha Go可以跟自己对弈不断精进棋艺一样,我们的AI老师他也可以通过不断跟AI的学生去模拟、演练教学,实现教学技能不断的自我进化,从而真正的做到千人千面,个性化的教学。
在2016年7越发不了AI英语老师,我们认为第三条曲线中间的一行字,是教育的一个新的形态。累计了一段时间以后,在当时发布的时候,我们也对AI老师所谓个性化的教学去做了一个效果、效率的测量。其实前面一位演讲者也提到了,人工智能老师能够30个小时,100个小时,其实说的是我们。这件事情我们是这样做的,在发布产品之前请了400名志愿者,他们在使用AI老师教学前和教学后都参加了一个线下的第三方标准考试,是由ETS,ETS是一个非常知名的考试机构标准化考试叫TalkingForeign 把学前和学后做了比对,并且把学习的时间乱了出来,拿到根据欧标推荐英语水平提高了一个级别,由人类老师来教需要一百个小时,但是我们的产品AI老师这些志愿者只花了36个小时提升一个级别,也就是说学习效率提升了3倍。
下面给大家看一些具体的例子,看了用户学员的学前和学后比对,把录音拿过来看有没有进步。这里给大家解释一下,横轴和学习的时间和天数,纵轴表示英语水平。可以看到不同用户有不同的学习的模式,比如说用户A是属于学习的时间比较长,学习的天数比较多,但是每天学习的时间不长,原点的大小表示在每天学习的强度。用户B可能是学习天数没这么多,但是每天练得比较勤快一些,但不管怎么样,用户在AI学习下有了进步。接下来大家听一听,是否有没有明显的进步。这是学习前的,这是学习后,我们再听一下用户B在学前。听一下学后的,大概经过短短的30天以后,可以听出发音更加的饱满、更加流畅,语调也更加好。
接下去再跟大家快速分享几个用户的故事,用户经过AI老师学习也取得更多的进展,他们来自各行各业。比如说在北京的音乐总监,他们在之前很多外国艺人来演出开口交流,后来学习了英语之后做得越来越大。比如说这一位是80后的全职妈妈,在陪小孩上班上学以后自己也有英语提升的需求,在流利说AI老师的学习下得到了一个长足的进步。这一个韩昱是10岁的小孩,在一年前她的英语水平其实连苹果都说不清楚,但是一个偶然的机会,小孩爱玩,有一次小小的车祸膝盖受伤了,必须卧床躺在病床上没有办法走动。这个时候她的爸妈给她下载了英语流利说,去练英语。后来她的病好了以后,父母觉得她当时玩流利说已经过去了,但是没想到韩昱小朋友后来上瘾了,每天晚上睡觉前都要找爸妈要手机学英语流利说打卡,后来打卡到100天、200天,到现在600天,坚持了两年以后英语水平远远超过了同龄人,在各项的英语比赛。还有一位是75岁的退休老师,这也是不安分的老人,他跟他的老伴爱人已经自驾游中国,各个省都去过了,去了70多天,他们想环球自由行,但是语言成为了他们的障碍。这位老爷爷也是教授级的工程师,学了几十年的英语,还是没有办法自如的交流,但是在我们的平台上流利说学了一段时间以后,实现了他环球旅行的愿望。
我们创业已经有5年多的时间了,回顾当时的初心,其实最早在创业第一天的时候,我们就坚信或者看到了所谓教育具备两个特点,一个是高效率和公平化。当我们打造了一个AI老师以后,因为AI老师是可以不断的被复制,可以真正的把AI老师送到每一个学生的手里,某种程度上也是认为能够帮助解决教育公平性的问题。
这业绩是前年2016年的时间,我们的一个用户他是一个广州的白领,辞去了他的工作去青海的一个藏区支教。当他来到孤儿学校的时候,发现学校里面大概有200多名孤儿,他们小孩学习成绩很好但是没有英语老师,他就联系到流利说,后来把我们的AI英语老师送到了学校里面去。在接下来的一年时间里面,藏区学校里面的这些孩子,他们每周花两节课的时间,由数学老师或者是体育老师把手机发下去,他们就是跟着我们AI老师学习。在去年暑假也拿到了一个比较欣慰的结果,这帮孩子在跟着AI老师学了一年以后,他们中考的平均成绩提升了20分。
展望未来,中国将在国际舞台上扮演更重要的角色,我们希望帮助国内人更好的对话世界。语言就是一扇窗,打开了另外一个世界。我们希望用人工智能的技术来做更多的创新,来提升教育和效率的公平,因为我们相信更好的教育会带来更好的未来。