乂学教育-松鼠AI首席科学家崔炜:如何用AI带来学习效率的革命
编者按:7月12日-7月14日,2019第四届全球人工智能与机器人峰会(CCF-GAIR 2019)于深圳正式召开。峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,深圳市人工智能与机器人研究院协办,得到了深圳市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流博览盛会,旨在打造国内人工智能领域极具实力的跨界交流合作平台。
7月12日,乂学教育-松鼠AI联合创始人、首席科学家崔炜博士为 CCF-GAIR 2019 主会场「中国人工智能四十年专场」做了题为《如何用人工智能带来学习效率的革命》精彩演讲。
乂学教育-松鼠AI联合创始人、首席科学家崔炜博士
以下为崔炜博士的演讲内容全文,雷锋网 (公众号:雷锋网) 做了不改变原意的编辑与整理。
大家下午好!我是崔炜,来自上海乂学教育科技有限公司,我们做的产品叫做松鼠AI。今天来跟大家分享一下过去4年多时间里,我们的人工智能技术在教育这个垂直行业的实践和经验。
教育是大家普遍所关心的问题,妈妈们聊天的时候最核心的话题就是孩子的教育,尤其是怎么提升孩子的学习效率,让他的学习更高效、成绩更好。
传统教育的困境
一是教育资源分配不均。在北上广深这些一线地区,如果想为孩子提供一个高质量的教育,很多人都会购买学区房。因为有了学区房,孩子就能上到一个高质量的学校,如果孩子想接受高质量的课外辅导,还要找一个一对一辅导老师,当然辅导费用也不低。
而且在现实中,老师的数量和学生的数量差距也是非常大的,名师的数量和好老师的数量是远远满足不了学生个性化教育需求的。
二是千人一面的学习内容。现在大部分都是千人一面的教育,所有的学生都是借助一种线性的学习方式,每个学生学习的知识点数量以及在不同的知识点上花的时间都是一样的,但是每个孩子的学习情况都不同。
三是统一划齐的学习速速。我们大多数人面临的是千人一面的教育,学习的内容是一样的,并且学习的速率也都是整齐划一的。事实上,每个孩子的学习速度都不同。
四是忽略了能力、思想和方法的培养。大多数的学校只是做知识的传输,并没有培养孩子学习的方法。孩子学习的知识过段时间就会忘记,因此孩子需要自己掌握学习的能力,这样才能不断地提升。
AI+教育会带来什么?
从AlphaGo开始,人工智能技术在不同的领域都取得了长足的进步,比如说在自然语言处理、计算机视觉、智慧城市等等方面,人工智能技术能够部分超越人类的能力。同时我们也相信人工智能在教育上也能模拟一个优秀老师的丰富知识经验和丰富的教学经验,并且它不仅是学习一个人,它还是一个集大成者,因为机器存储的数据量是很大的。
松鼠AI就是要解决个性化学习的问题,我们希望用AI和大数据的技术手段,帮助每个孩子,给他们带来高质量、个性化的学习。松鼠AI是基于人工智能自适应学习的技术,把过去千人一面的教育转变成千人千面的教育。就像今日头条给每个人推荐个性化的内容,我们也希望用AI技术实现因材施教,带来个性化的教育。
松鼠AI希望能够模拟上百名优秀老师的经验,这样就能够针对不同学生的学习风格、学习的情况,给每个学生带来他所喜欢和偏好的教学方式,并且给每个学生带来最适合他的学习内容。
同时我们针对每个学生学习的速度和学习的能力,安排最合适的学习的时间,量身订作他的个人学习解决方案。我们除了培养学生的知识获取之外,同时还会在学习的过程中培养学生的思想、能力、方法,让每位学生具备终身学习的能力,在AI时代不会被淘汰掉。
我们相信人工智能给教育带来的不仅仅是一个工具,给教育带来的是让个性化的教育规模化,让因材施教普及化。
AI自适应学习
其实人工智能跟教育的结合,通过人工智能、大数据打造教学机器人,并不是最近几年才有的事情。其实在19世纪20年代,美国的一位科学家Sideny Pressey就发明了世界上首个教学机器,学生在系统上能够自我做题,并且获得题目的解答信息。
在最近10年内,人工智能教育技术才得到一个迅猛的发展,像深度学习在图象识别领域的应用一样,也是由于人工智能算法的成熟和计算力的增强,以及大量数据的积累。教育行业也是由于这些类似的因素,导致了人工智能在教育行业取得突飞猛进的发展。
在国外,已经有接近1亿多的学生使用了人工智能自适应学习的产品,并且有大量的数据研究有效证明了机器学习能给学生带来很好的学习效果,包括节省了学习的时间,并且提升了他们的学习通过率。
人工智能自适应学习的产品大概分为两种:一是精准“诊断”,了解每个学生的学习状况;二是高效“治疗”,针对每个学生学习的情况定制高效的解决方案。
细化来说有四个方面,首先在学生学习之前做一个自适应的测试,通过动态的自适应测试,我们能够发现学生的问题。然后,学生在我们的系统上完成学习,系统能够实时采集到所有数据,形成学生画像,实时评估学生的学习情况、能力水平。
有了学生画像之后,我们系统就能够给学生做一个量身订作的学习解决方案。这个解决方案包括两个方面,第一是给学生推荐最合适的学习内容,帮助定制个性化的学习内容。第二是个性化的学习路径规划,学生先学习哪些知识点,后学习哪些知识点,以什么顺序完成学习,以最大化提升学生的学习兴趣,让学生单位时间学习到的内容更多,能力提升更高。
AI的能力最主要是体现在几个方面,第一是精准的知识漏洞的诊断。对一个真人老师来讲,要做到精准的知识漏洞诊断,他必须是这个学科专家,必须有几十年的丰富教学经验,并且他还需要对这个学生非常了解,对学习的知识体系非常熟悉,才有可能发现这个学生的问题。
AI的技术应用在此,就是要模拟这个老师丰富的知识经验。我们通过一个自适应的测试,能在学生的知识空间里快速定位到学生的知识点漏洞在哪里。知识点的数量是非常庞大的,就整个初中数学来讲,我们把知识点进行拆分,可以拆分成3万多个知识点。如果要找到他的薄弱知识点,问题在哪里,过去传统的做法是采用考试和复习的形式,在中考前有几轮复习考试,高考前有几轮复习考试,需要花一两个月的时间,每个学生在一两个月之后才能知道自己的问题在哪里。但老师的时间、精力有限,他不能帮到所有的学生。
通过AI技术诊断学生的问题在哪里,我们主要依靠的是信息论、贝叶斯理论、知识空间理论。比如说哪个特别难的知识点学生没掌握,那说明这个学生后面的一些知识点也不会,通过知识点之间的关联性,能够快速在庞大的知识空间里定位到每个学生的知识和状态。
找到学生的知识漏洞后,每个学生的知识漏洞、薄弱点不一样,我们的AI算法接下来会给每个学生定制他的学习路径,学生学习的兴趣不一样,学习的知识点数量也不一样。同时我们会给每个学生在每个知识点上安排最合适的内容,依据学生的不同能力水平,来分配学习的时间、学习内容的难度和做题的数量等等,这样每个学生在系统里都可以按照自己的节奏去学习,以前一个20小时的课程,今后学生可能只需要10小时就能完成。
松鼠AI智适应学习引擎架构
我们的智适应学习产品从2016年初上线到现在,已经有差不多4年的时间,主要覆盖了从小学三年级到高中一年级的五门学科:语文、数学、化学、英语、物理。后面我们还会推出科学、历史、政治、地理等学科。我们目前在全国400多个城市,已经有超过2000个合作校,帮助到了200多万学生,能够给他们带来高质量个性化的学习。
这个智适应系统需要什么样的结构来实现这样的功能呢?我们的系统是用AI引擎驱动的,主要包括5个模块,分别是:智能推荐引擎、智能反馈系统、学习分析系统、多模块综合行为分析系统、虚拟助教。最核心的是智能推荐引擎,包括知识状态的诊断、能力水平评测、动态学习时间、战略放弃、追根溯源以及动态学习目标规划。
我们的系统架构分为三层,我一般把这个架构比作大脑。第一层是学习情境,松鼠AI引擎本体,包含内容图谱、学习图谱、错因分析本体以及动态学习目标。通过这些,我们能模拟一个特级老师丰富的知识经验、完整的知识体系结构。第二层是核心的推荐引擎,包括学生画像、学习记录库、用户状态的评估引擎、实时分类和预测、目标管理引擎、高级诊断和VPA引擎。第三块是学习管理、系统的核心,相当于人大脑的耳鼻眼,跟用户实时交互,包括监控预警系统、学习管理系统、采集系统等等。
在每一个功能里面,我们都是采用了不同的算法,因为学习是一个比较复杂的过程,并且覆盖了多个环节。松鼠AI引擎是完整地覆盖了整个教学过程,也就是说在我们的系统里不需要老师的干预,学生可以通过这个系统自己完成学习的目标。
我们也采用了深度学习的技术,提升我们推荐的精准性。更重要的一点是,我们在整个学习过程中采用了动态学习目标管理,因为我们知道不同的学生,学习目标是完全不一样的。对于学渣来说,60分已经是一个很好的目标,但是对学霸来说,90分可能都是不够的。并且在这个过程中,学生也是在变化的,当学生学习成绩提升之后,学习目标也会发生变化,所以在这过程中我们对他的学习目标是始终动态变化的。
学习目标变化包括两个方面,第一是学习的知识点变化,对学渣来说,单位时间内学习的知识点数量会更少,对学霸来说,单位时间内学习知识点的数量是会更多的。第二是达标目标不同,对学渣来说,达标的知识点要更多,这才是有价值的。我们可以预测学生在学习后面的知识点上的掌握程度,可以预测接下来,单位时间内学习知识点的数量,可以预测学习这个知识点要花费所少时间,还可以预测在期末考试里面能考多少分数。同时还有一个分类的预测,我们把不同的学生的学习情况进行分类,学生之间也能形成一个小的群体,能够互帮互助。
知识点、思想、能力、方法拆分
除了有人工智能算法的应用,在教育里面跟算法同样重要的是我们的学习内容。因为再好的算法,如果学习内容质量比较低的话,对学生也是一个灾难性的后果。
所以我们有几点措施,首先是学习的本体,我们对知识点的拆分做到非常精细,保证每个知识点都是最小颗粒度的,学习起来会更加高效,能够精准定位到学生不会的点在哪里,不会的原因在哪里。
除了知识点的拆分,还构建了知识点的关联性,不同的知识点存在逻辑关系或者是认知关系,就像老师一样,有自己的方法,在教授这些知识之前,会把最基础的知识点教授给学生,这些认知的关系、知识图谱的关系,存在在老师的脑海里面,我们采用了基于贝叶斯的知识图谱构建了知识点之间的关联性。
除了学习知识点之外,我们还做了思想、能力、方法的拆解。因为在未来信息爆炸的时代,学生具备了思想拆分的方法,即使学习的知识忘记了,学生也具备学习的能力,而且这种思想和方法在生活和工作中也是无处不在的。
此外,高质量的学习内容,针对每一个知识点,无论是思想、能力、方法,我们都匹配有不同类型的知识点讲解的视频,以通俗易懂、形式多样的方式,拍出不同的视频讲解内容。我们的视频也有适合不同学生的,比如说对学霸来说,我们会推荐难度比较高的视频;对学渣来说,我们会推荐难度比较低一点的视频。每一个知识点的讲解视频,大概只有1-7分钟,根据不同的年级,视频内容的时长也不一样。
另外我们还有多输入学习行为分析,刚才郑宇博士也讲到了,物联网时代感应无处不在,我们也会通过一些外部的设备采集学生不同的学习情况。例如,通过摄像头采集学生的眼球运动等动态数据,同时我们还会通过脑环采集学生的脑电波数据,采集多种来源的数据,分析学生在每一时刻的状况,这一时刻学生是正在走神,还是非常专注,这样可以更好地帮助这个学生,进行个性化的干预。
老师在教学模式中,不需要亲自去关注这个学生,通过我们给老师提供的教师系统,一个教师的仪表盘,可以关注到每个学生此刻在学什么知识点,做什么题目,这个学生的专注程度如何。教学系统还预备预警的功能,可以提醒老师,这个学生需要关注一下,那个学生需要辅导一下。同时我们的系统为了给学生带来更好的学习体验,我们开发了一个人机对话系统,能够让学生更好地跟系统进行人机交互,这是我们正在研发的一项功能。
机器教学,老师育人
松鼠AI的智能到了什么程度?我们请美国的一家机构给松鼠AI做了验证。我们做了一个实验组和一个对照组,实验组是按照我们的方式来做,对照组是按照传统的授课方式,一个老师带几十名学生。
我们通过前测和后测的试卷,保证考察的知识点范围是一致的,对比前后测卷的考试的差异性,对比他们的学习效果如何,每次时间限定在一周之内,目的是为了让影响学习过程的干扰因素降低到最小,因为学习时间越长,干扰因素越多,对最后的结果影响也会最大。
虽然我们在这四场的实验里都是有效证明了,我们比真人老师的教学效果是更好的,但是并不代表我们的系统是一个能够完全取代老师的系统,是更好的系统。
在我们的教学模式里希望每个学生能够提升效率,并且也能帮助老师减负,让教育变得更加公平。所以我们以机器为辅变成以学生为中心,回归到因材施教,把教育拆分为教学和育人,教学由机器来做,因为机器的存储量大计算量大,可以清楚了解每一位学生的学习情况,并且永久记录下来,这一点能够做到比所有的真人老师更加清楚了解每位学生的学习情况。
机器是没有温度的,但育人是有温度的,这些事情可以由真人老师来做。真人老师过去需要备课、授课、批改作业,我们可以把老师从这些工作中解放出来,让老师做更有价值的事情,跟学生沟通、交流,培养学生的创造力、想象力和终身学习能力,这是未来每个孩子应该具备的能力。
我们的系统也在不断地迭代和优化,我们会分析我们的数据,然后找出我们系统的问题所在,不断地优化迭代我们的产品。同时我们也在跟世界上顶尖的人工智能机构合作,去年底我们聘请了美国卡内基梅隆大学的计算机学院院长、机器学习教父 Tom Mitchel 教授作为我们的首席人工智能科学家。此外,我们跟CMU联合成立了一个大规模个性化学习教育的联合实验室,我们还和美国斯坦福国际研究院成立了AI自适应学习的研究室。
我们在其它一系列的学术会议上受邀做分享以及在我们自己举办的一些活动分享上,主要是针对人工智能在教育中的应用,也希望全球对人工智能教育感兴趣的专家能够和我们一起来做这件事情,让教育变得更好,让我们这个社会变得更好。
谢谢大家。 (雷锋网)
。