机器学习教父 Tom Mitchell :人工智能将成为自适应学习的驱动式技术
雷锋网 (公众号:雷锋网) 消息,11月15日-16日,“全球AI+智适应教育峰会”在北京嘉里中心大酒店盛大开幕,峰会由雷锋网联合乂学教育松鼠AI,以及IEEE(美国电气电子工程师学会)教育工程和自适应教育标准工作组共同举办,汇聚国内外顶尖阵容。
AI 自适应学习是目前产学研三界关注度最高的话题之一。此次峰会邀请到美国三院院士、机器学习泰斗 Michael Jordan,全球公认机器学习之父 Tom Mitchell,斯坦福国际研究院(SRI)副总裁 Robert Pearlstein、美国大学入学考试机构 ACT 学习方案组高级研究科学家 Michael Yudelson 等顶尖学者。
在 16 日上午主论坛上,Tom Mitchell 带来了一场精彩的主题演讲。以下为他的演讲内容,雷锋网 AI 科技评论整理。
我认为这 10 年对自适应教学来说是最好的 10 年,因为我们开始看到技术变得成熟,越来越多的公司开始运用这些技术,我相信本次会议将是这个领域的转折点。
我今天主要想跟大家谈几点想法,内容主要关于 人工智能可以如何与自适应学习产生联系。
YouTube 上截取的这几张图片告诉我们什么是自适应学习。在自适应体系中,老师会不断地评估学生的能力、发现他们的不足点、给他们设立目标、发掘他们的学习需求,甚至根据他们的学习速度来提供更好的建议。我们发现已经有系统开始在做这件事情,然而都处于早期阶段,我们接下来的工作重点应该更多放在系统改善上。
机器学习和人工智能,将成为自适应学习的驱动式技术
机器学习这 10 年的发展非常快。比如一开始表现不怎么理想的计算机视觉,后来的识别精度已经变得几乎跟人眼一样;语音学习的情况也一样;还有围棋,AI 已经成功打败了世界冠军;机器人汽车方面,我们将迎来越来越多的无人驾驶汽车。
展望未来,机器学习将如何促进 AI 的发展,进而促进自适应学习的发展呢?这里有三个问题值得我们来一起来讨论:
1. 机器应该学习什么?
我们需要个性化的、基于每个学生的教学战略。我们希望机器可以根据学生的退学率、学生的考试成绩来提出一些建议,包括老师应该在什么时候介入,以及老师应该如何在学生和机器之间进行介入等等。
2. 应该从哪些数据中进行学习?
现在存在各种类型的数据,当中包括环境式的数据,比如说教室里的摄象头、耳麦、话筒等等,通过这些环境数据我们可以更好地了解学习者的情况;身体的传感数据,比如说智能手表、智能椅子,可以感知到学习者当下的学习状态;还可以通过 EEG 监测大脑的数据。总之,选择什么样的数据来源,对机器学习来说很重要。
对机器学习来说同样很重要还有算法。
以监督式学习为例,卡耐基梅隆大学一名博士生提出的网络可以预测哪些学生会从网课中退学。它监测的数据包括学生在课程上花的时间、鼠标的点击数等等,实现从输入与输出两端进行监测。
由于监督式学习对自适应教育来说很重要,所以我们需要一系列的技术来提升监督式学习的精确度和效率,同时考虑学习环境的情景。从预测学生会从哪门网课中退学,从而预测该学生会不会也从其他课程中退学,是在跨任务转移当中需要我们重点关注的。
3. 多任务处理学习
这是 20 世纪 90 年代末提出的学习理论,要想提升系统预测的准确度,就要将其他变量也一并考虑进来。比如说监测哪个肺炎病人的病情将会恶化,除了肺炎本身的严重程度,我们还会一并考虑病人的白细胞数量、是否曾经转入 ICU 治疗等等,通过这种方式来更好地预测病人肺炎恶化的几率。同样的模式运用到学生的退学率预测上,我们可以将学生的其他变量如期终考试成绩等一并考虑进来。
这个技术之所以能成功,是因为它可以训练我们的系统进行包含多变量的预测,在这过程中会产生一些归纳程序,进而有效提升系统的预测效果。
另外一个有意思的算法是非监督式学习。
这是我的同事在卡耐基梅隆大学做的研究,他们根据学生回答问题的正确率,对学生进行分类。大家可以看到图中有三种不同颜色的曲线。
绿色一组最开始的表现特别好,后来表现突然下降了,之后再没之前的表现好。对于非监督式学习,只要发现一个规律后我们就可以进行干预,比如我们可以预测这三组学生的期末考试成绩,以便更好地指导其他学生。
接下来谈一下增强学习,这种算法的特殊性在于,我们会在不同的时间点给予不同的行动指示,比如 AlphaGo 就是通过这种方式不断增强自身能力,最终打败了围棋冠军。简单来说,围棋上的每个点、走的每步棋都是决策过程,我们通过设置一个奖励机制,不停地告诉系统应该如何做才能取得成功,在这过程中将产生数百万个行动的序列,我们通过这种方式反复对网络进行训练。
这种方式其实是跟自适应学习非常类似,在自适应学习中也存在不同的状态和行动,这个状态指的是学生的学习状态、心理状态等;而行动则指教学行为,比如我们应该进行考试、视频播放还是学习评估。我们可以定义奖励机制,让机器告诉我们什么样的行动更能促进学生的学习。
增强学习在过去 5 年取得了很大的进展,过程中产生了很多富有变化兼具个性化的模型。在机器学习的研究人员来看, 这些沉淀下来的抽样方法、算法选择、数据选择,对于发展AI + 教育而言是个宝藏。
机器学习 + 教育的探索
我们来看一些更加具体的研究。这是我同事正在做的,让人可以跟计算机产生互动。这个系统可以做到每一秒都在追踪人类的面部表情和语音,从而推断出这个人的情感状态,荧幕上的红点在不断地移动,反映的是这个人的情感状态。当系统推断出学生存在沮丧和消极的情绪,这时老师就会介入提供帮助。当老师与学生一同将问题解决时,系统检测到了学生的积极情绪。
这个技术一旦实现,老师可以根据系统每秒钟的反馈,找出哪一名学生需要被指导。 研究发现,教师延时的反馈和负面影响是有正相关关系的。
这是我给大家举的一个例子,可能会对教育界产生非常大的影响。
另外一个很有意思的研究方向是 探索新的教学互动方式。 我们发现,通过教别人我们自己反而能学得好,因此,我们考虑让学生充当老师的角色,教导由计算机扮演的模拟学生。模拟学生通过屏幕征求人类的解答,而学生则负责教导模拟学生正确答题,在这过程中,我们会引入教学督导的角色,一旦学生在教导的过程中遇到问题时,教学督导将及时进行记录和指导。
我们发现这种方式比传统的教学更加有效, 然而只有人工智能技术发展到一定程度,我们才能实现这种教学。
为此,我的团队试图建立一个能让学生对计算机进行教学的系统。这个想法最初跟教育没什么关系,我们主要想让手机用户能够对手机进行重新编程。比如我们跟机器说「四点钟的时候我们要开会」,机器会说「我不知道四点钟开会是什么意思」,然后接着说「你想要教我的话你就教我」,我们会跟系统解释「下午四点开会」是什么意思,接下来分别要做什么事情,系统经过训练之后,他们在第二次就会快速理解这主人的指示,这是自然语言学习向来的做法。
这里要强调两个理念, 第一个是每句话的句式都是可以被执行的 ,我们可以对句式进行翻译并且变成可执行的代码。 第二个是系统会不停学习新的步骤 ,最开始它可能不知道「告诉」是什么意思,而现在它知道了。这个研究最开始只是一个小想法,并没有想到要应用到教育上,后来我们发现如果能把这种想法与当前的教育行业结合起来,当中的潜力是很大的。
最后给大家做一个总结,这是对自适应教育来说最好的一个时代,人工智能会是这个时代的主要驱动力,将方方面面改变数据的本质,我们会收集到非常多人与电脑之间的互动性数据,这些都可以应用到对话式学习上。过去我们会觉得教育是老师和学生之间的事情,现在我觉得它老师、学生和电脑之间三方的事情。
中国在此拥有独一无二的优势,有望在 AI 教育领域成为世界的领航者,能够向其他国家展示如何运用这方面的知识。
最后感谢大家的聆听,谢谢!
。