乂学教育产品合伙人张栖铭:如何打造一个虚拟的特级教师
雷锋网 (公众号:雷锋网) 按:在传统教育里,学生按照时间进行升学,但或许一个八年级的学生,因为没有掌握好一个六年级的知识点,从而变成一个差生。AI 或许将彻底改变这一传统教学模式下的弊端。乂学教育产品合伙人张栖铭,日前在 FMI人工智能于大数据高峰论坛上,以《人工智能时代下的自适应学习》为题做了演讲,并向雷锋网在内的媒体和观众讲述了乂学教育部署自适应学习系统的理念和方法。
以下为乂学教育产品合伙人张栖铭演讲,雷锋网在不改变原意的基础上做了精编:
简单介绍一下我们研究的课题,实际上是希望能够把我们的系统打造成一个虚拟的特级教师,在正常的学校里,特级教师的数量很少,当你真正接触到一个特级教师的时候,会发现教小孩子学习的思路、思维的,可能跟普通的新手老师会有很大的不一致。我们希望能够把系统收集到的特级教师的经验,结合数据,模拟一个特级教师,我们也会做一些学生画像的建立,包括学生个人的画像,学生群体的画像,在这个基础上做个性化的匹配,优化整个教育模式。
这是一个比较常见的一个自适应学习产品的框架,分为三个部分:用户交互层,学习系统,自适应引擎。
前两个部分,市面上绝大部分的自适应产品基本上差不多。因为学生的学习场景、老师的教学场景基本都是类似的,自适应学习当中主要的不同点在于学习目标的规划。传统的教学模式当中,老师讲什么大家听什么,就像现在我站在台上讲什么大家没有办法点播,只能我讲什么大家听什么,自适应系统可以做到动态的,学习目标是什么?学习目标就是一个学生需要学什么。
在传统教学过程中,老师讲什么学生就得学什么,例如一个八年级的孩子,他有可能底子比较弱,六年级的东西都没有学好,你让他直接学八年级的内容是有问题的,所以我们整个学习目标要进行动态规划。
自适应学习引擎方面主要分成三个方面:
-
内容推荐
简单来说,就是这个孩子下面需要学什么,需要做题还是测试,各种各样不同的推荐,内容推荐跟学习规划有一致性,对不同学科,不同学段的建模,不同学科在整个学习的路径,学习的思路上面都有一些不一样,包括不同的学段(小学生、初中生、高中生),对于学科的认知、学习的模型都是不一样的,我们需要针对不同的学段和学科构建模型。
-
学情分析
学情分析就是这个学生曾经学过什么,做过什么,跟老师做过什么交流,交流了哪些东西,他以前的情况是什么?其实整个咨询当中,绝大部分是做学情分析,刚才我说的是一个个体,针对群体,我们怎么样把这些东西分析的到位,更好的做内容推荐?
-
内容分析
构建好学习的模型以后,可能干了很多事情,怎么保证推了这套题,他作对,就能够说明这个学生知识点掌握了?当你有内容组合出来的时候,同样的题目展现出来的难度效果是不一样的,如果大家对于教育了解的多一点,可能有比较清晰的认识。
举一个大家都能理解的例子,做口语评测的时候,我们拿到了整个中国所有人讲口语的数据,是可以做一个打分的,但当你对一个带有重口音地区的人进行打分,按照全国统一的模型来打,是有问题的,针对这个地方打分的时候,可能就是矮子当中选个将军。这题目当中内容分析是相对比较类似的。
我们现在主要的基础和理论,除了人工智能技术,还有大数据分析技术,核心还会应用到一些教育测量系统,这也是人工智能的一个特点。
整个智能引擎方面,从功能层面来讲我们主要是五大功能,但如果用最简单的方式来划分,核心就是两点:
-
预测
-
推荐
预测就是我们预测出一个学生,他当前的状态是怎么样的;推荐,就是推荐最符合他当前状态,需要学习的东西和内容。
说到教育,大家首先会联想到,教育是个什么样的东西?
我们从小学上到高中,上到大学,很大程度上我们学什么取决于国家,国家是怎么定义整个课程的,上大学哪一些专业是热推的。培养什么人,是国家从最大层面上考虑的,怎么让国家更有竞争力,怎么保证经济正常发展,怎么跟美国在各个领域上竞争,这个国家从大的层面定义。
2500年前,孔子就说过因材施教,教无定法。他当初就提出来,要因材施教,教无定法,针对群体的情况一定会存在很多很多的问题。
现代标准化教育的奠基,我们通常情况下会认为,是因为普法战争,普鲁士战败以后做了一个大学,定义了整个标准化教育的情况,大家按统一的年龄入学,进去以后所有的学科全部分好,每堂课45分钟,分年级,一层一层的考核。其实这里面会存在很多问题,可能一对一或者个性化的东西相对是更好的。
标准化可以做到,大范围把全民的基本素质都做一些提升,形成这个效益体系是非常有意义的,但弊端相对比较明显,标准化的课堂是一个老师站在那里讲,底下有无数的学生,老师怎么去讲呢?学生刚入学的时候,大家做一个摸底考试,大概知道学生是什么样的水平,摸底考试以后,老师批改完,知道这帮学生这些知识点掌握的好,那些知识点掌握的不好,那上课的时候就按中等偏上的水平来讲,大概中等的水平是什么样子的,按这个来讲。
实际讲的过程,老师在台上问,1+1等于几,有一些人可能在玩手机,有一些人在打岔,一个反映特别快的孩子说1+1=2,老师特别开心,觉得这帮孩子还不错,继续往下讲,讲完一堂课以后,也不管学生学的怎么样,继续往下讲。
对于这种情况,我们称之为课堂黑洞,老师课堂上了解到的很多内容是比较表象的,他根本不知道绝大多数学生情况怎么样的,一到考试的时候就打脸。
其实就会存在很多的问题,老师讲的东西绝大部分学生根本听不懂。就会产生一种现象,我们称之为瑞士耐劳式的学习方法,从外面看这个学生是一个整体,切开很多东西他没有掌握好,没有掌握好的时候,又会带来一个问题,这个小孩学着学着突然有一天学不动了,老师就说是不是玩游戏,很有可能是由于他八年级的一个知识点没有学好,导致以后的学习很难进行下去。
总结一下,我们现行的教育模式希望在固定的时间里面,让学生能学多少是多少,但是不考核,不希望学生达到一个最高的目标。我们做自适应学习,有一个观点,在系统里边制定一个最高目标,你可以花无限长的时间去学习,这也是现在标准化的课堂,很难去解决的一个问题。
标准化教育造成的一个情况,流水线、工厂式教育,所有的小孩子,原来不一样,到学校里面溜达一圈以后出来都是一样的,每一个学生都是千人千面,不同类型的孩子,在真正的教育场景下有非常复杂的表现。
从1990年左右,逐渐出了一些单机版的教育,或者说一些工具以后,后面也在不停的发展,包括互联网兴起的时候,互联网+教育,解决现实当中小孩子遇到的问题,到后面的O2O浪潮,大家都很清楚,真人一对一。再到现在人工智能浪潮,包括在语音评测,作文批改等等,也包括我们在做的一些自适应学习,其实最近都在逐步兴起。
技术在不停的发展,我们也在很仔细的考虑,人工智能到底可以替代老师的哪些工作?我们也总结了一下单向传播的工作可能相对比较好替代,知识传递方面,我们认为可以解决百分之七八十的问题。
什么叫能力培养?其实教学体系都是为了培育学生的能力,很多人说我在学校学的很多东西,出来以后都没有用,实际上你学习以后折射成不同的能力,因为被高度抽象了,在实际过程中我们认为可以替代到百分之七八十,偏主观、偏体育方面的东西,这些东西是机器学习比较难替代的。
2007年开始,当时很多公司在做,比尔盖茨基金研究完以后觉得这是当下最需要的东西。
时间有限,说一下我们的过程,在上课的时候,假设出一个虚拟角色叫小明,他数学课听不懂,抛物线听不懂,解析式根本不会,在这种情况下,我们来做一些抽象,假如数学只有5个知识点,那可能性应该是32个,每一个知识点都有会跟不会两种,2的5次方,把所有的状态,知识点的组合状态全部弄出来了,就会发现一些比较有意思的问题。
如果会A知识点才会B知识点的时候,这里面的很多情况是不存在的。这种情况下我们可以把很多不可能的状态去掉,这是我后续拼出来的13种状态,大家发现只有学完A以后才能去学D和C,A和B知识点可以同时来学的,这样的一个技术,我们要构建一个知识图谱,知识图谱的意思就是把很多知识点尽可能的细分,把它的前后的关系整理出来,整理出来,我们就有一个比较好的点,我们可以把很多不可能的状态去掉,这样可以极大的降低整个系统的计算量。
从实际情况来说,其实数学是有非常多知识点的,就像我们自己整理出来的数学,一个年级所学的基本上可以达到400个知识点以上,这些知识点可以做到足够细分,每一个点都代表知识图谱上的一个状态点,这张图出来以后,针对不同的学分,因为每一个学分都是不同的类型,对同样的内容,都有一些不一样的反馈。这样的情况下,我们会生成他的学习状态,去决定,你在当前的状态的时候,你下面有哪一些可能的学习状态。
简单来说,我们会找出任何一个学生的能力边缘,如果按一条线来划的话,左边是全会的,右边是都不会的,从不会的里面挑选最匹配要学习的内容,或者学习最高效的,这些也是根据学习目标会有不同的策略。
数据分析方面来看,搜集一些,预测一些,分析一些,核心就是预测,针对不同类型,去搜集数据,并且分析每一个角色的人可以看到他的报表,针对他做个人最匹配的东西。通过知识状态框架,利用二次方程可以作为一个知识点,我以联合到十字相乘法,只有通过这种方式才能更精准的定位到一个学生的基本理论掌握状态。
从个性化匹配方面,结合学生画像,内容侧写,机器学习和概率图模型,个性化学习内容和路径匹配,我们真正和棋盘对比,发现知识点的数量,远远多余棋盘的数量,题目的组合,其实是非常多的。
个性化学习路径方面,大家可以理解成百度地图导航,百度地图的导航可以实时的切换,可以做到比老司机更好,我们的系统也是希望做到比特级教师更强的状态,而且发挥比特级教师发挥更稳定,当你有一个系统的时候,每招一个学生,增加的成本很低,特级教师很难遍及到全世界学校的每一个角落。
我们针对每一个知识点都会做知识点的讲义,知识点的错误分析,在这种情况下分析教学内容的时候,大量的数据进来,可以分析一些因果关系,你看了哪些东西,学习出来的效果更好,通过这种再对学生做个性化匹配的学习内容。
当知识图谱形成以后,发现八年级的东西不会,我很有可能追溯到七年级甚至六年级。很多时候生物当中学习的东西,一个小孩生物学不好,有可能是数学不好,这种跨学科追根溯源方面的东西,也在逐步的探索。
从学生专注度方面来说,很多小孩子学习不好的时候,表现出来的就是调皮,我们在杭州的校区里面遇到一个小孩子每次考试都考0分,家长强迫他到我们那边学习一段时间以后,学习了一个多月问他,要不要继续交钱让你继续学,孩子说可以,家长问他你为什么继续学,他说学校讲的所有东西他是完全听不懂的,但是在我们这边的时候,当我们发现他的底子很差,他是八年级学生,我可以一直给他推到六年级,到更低的年龄的时候,他感觉推出来的东西是他会的,这时候他的专注度和成就感是完全不一样的,这是自适应学习,真正能够匹配学生当前能力的点。
。