数博前沿 ▏欧美大学是如何使用大数据的?

数据观  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

 从学费个性化到成绩管理,高校运营日益受到数据的驱动。

 “你可以说它大胆、疯狂,甚至傲慢自大。但我觉得:如果乔治亚州立大学要做一件大事,就应当以此为目标——一旦实现,就将改变世界。”

 乔治亚州立大学校长马克·贝克(Mark Becker)回想起2009年刚上任时做出的决定:在有关该校宗旨的表述中,有关学生留存率和毕业率的措辞,并将其放在更优先的位置上。

 这个目标是:“证明各种背景的学生都能以很高的比例,实现学业与职业上的成功,使乔治亚州立大学成为本科教育在全美的典范。”至于如何实现该目标,当时的他毫无头绪。然而,不到三年,该校的黑人、西班牙裔、低收入以及家中第一代上大学的学生毕业率就与全体学生持平了,这在美国高等教育领域尚属首次。

 贝克实现这一重大里程碑,全仗数据分析,即人们常说的大数据。这需要收集大型数据集并加以分析,揭示模式与趋势。各大学越来越多地利用这种方法对学生和教职员工进行高效的支持和管理,并制定战略管理决策。

 美国的高等教育领域一直面临学生留存率的问题,关键原因是课程收费高,以及学生准备度低。根据美国国家教育数据中心的数字,就四年制学位教育而言,三分之一的学生未能在六年内毕业。

 但一些群体的这一比例更惨,比如非白人学生、家中第一代大学生,以及来自低收入家庭的学生。举个例子,每十名黑人学生中,只有约四人可以在六年内毕业。因此,美国院校的毕业率在很大程度上与招收的学生有关,表现最好的院校,其招收的富家子弟的比例通常较高。

 乔治亚州立大学是一所大型研究型大学,但学生构成却不同于相似院校——它有半数以上的学生来自低收入家庭。“在美国,这些学生的毕业率数据令人愕然,于是,我们就开始行动,想证明这是可以改变的,”贝克说。

 在副教务长蒂莫西·雷尼克(Timothy Renick)的带领下,贝克的团队展开了一番调查,他们发现,在乔治亚州立大学,很多学生都在努力攒学分,却始终够不上毕业线。之前没有人注意到的是,学生们经常错选跟专业不符的课程,或是早选了高阶课程,于是不得不补课以追赶进度,或是挂科重修,浪费时间与精力。

 该团队总结认为,其原因在于没有提供合适的指导机制——而对贝克而言,在提升毕业率的征程中,这个问题算是比较好解决的。“当时我们就决定,要投身大数据,要设立全校园范围的学生顾问组织,”他说。

 在他意识到这一点的同时,教育领域数据分析的新技术也开始涌现。2011年,乔治亚州立大学率先引入软件供应商Education Advisory Board。该公司在校园里用几周时间构建出一个系统,专门追踪学生们每天做出的成千上万个决定,并以此为据,预测他们的学业成绩。

 该公司使用每个学生前十年的数据,加上他们在乔治亚理工大学的分数与课程,开发出一个模型,并加以校准。该模型于2012启动运行。每天晚上,系统都会检查该校3万名本科生的800多个相关变量,标记出模型认为会遇到困难的学生。

 这些数据包括所选课程、出勤记录和成绩。但每个变量与不同学生的相关度各有不同:很大程度上要看选课情况与行为表现。举个例子,对英语专业的学生来说,数学课得B-也许问题不大,但对化学专业学生来说,这可能就是麻烦的征兆。在这种情况下,系统会给学生及其指导教师(advisor)发出电子邮件或短信,请他们碰头讨论这一问题。启动后的头一年里,该系统发出了5万条这样的消息。

 效果立竿见影。“第一年,辍学率就下来了,毕业率就上去了,”贝克说。乔治亚州立大学的平均毕业时间缩短了半个学期。相对于2012年毕业的学生,2016年毕业的学生少花了1500万美元的学费。而学生留存率每上升1个百分点,校方的投资回报就增加300万美元。

数博前沿 ▏欧美大学是如何使用大数据的?
 

 贝克说,没有数据分析,这一切都不会实现。对他而言,数据分析妙就妙在:有了它,大学能以一种可负担的方式,针对数万名学生实现教育体验的个性化。“我们的系统现在所做的,就是小型院校的教授所做的,也就是看好学生们。看到什么就设法干预。”

 除了乔治亚州立大学,大学创新联盟(University Innovation Alliance)另外10家院校也使用大数据提振学生成功率。该联盟成立于2014年,由美国公立研究型院校组成,专门解决接受过大学教育的美国劳动人群的需求。在2014年的一场白宫活动上,该联盟的成员宣称,未来十年,他们的毕业生人数将额外增加6.8万人,该计划的核心就是预测型分析。按照现在的进度,他们将超越上述目标,实现9.4万人的增长。

 在联盟成立时,包括乔治亚州立大学在内的三个成员院校就已经在使用数据分析。这些“导师”院校计划通过实践,检验不同的大数据战略,并将成功的战略加以推广,辅助联盟内各院校的管理决策与学业规划。在乔治亚州立大学,另一个正在使用大数据的方面就是招生。接受了入学邀请但尚未注册的学生可以通过短信提出疑问,而聊天机器人会搜索常见问题数据库,给出相应的答案。这些学生“跟非人类展开短信对话,他们自己可能都不知道,”贝克说。

 亚利桑那州立大学是联盟内另一家导师院校。负责学生学业的副教务长阿尔特·布莱克莫尔(Art Blakemore)表示,大数据渗透到了该校的方方面面。比如最近,该校将大数据引入课堂,将目标对准了学生学习道路上最大的拦路虎之一:数学。“很多学生进入亚利桑那州立大学时,对大学数学都没有做好充分的准备,”布莱克莫尔说。他表示,这个问题在美国各地的高校都存在。

 为克服这一难题,该校废除了一视同仁的数学课程,取而代之以“数学商场”,学生们自行安排时间,在辅导员的帮助下,坐在电脑前学习课程内容。

 “这与课堂学习刚好相反,”亚利桑那州立大学负责本科教育的副教务长弗雷德·科瑞(Fred Corey)说。在开始学习前,软件依照课程学习目标,对他们的能力作出评估,将他们置于合适的起步点,避免重复学习。在学习过程中,软件将持续对学生进行评估。“课程软件一旦检测到学生的不足之处,就会立刻提供针对性的补习……它是完全个性化、灵活调整的,”布拉克莫尔说。结果,该课程的通过率从65%提升到了85%。

 采用此种做法的还有其他一些面向大一新生的大课,比如代数、生物、化学、历史和心理学,经济学也将纳入其中。“我们将焦点放在低年级课程上,以便给学生一个合适的起始点,”布拉克莫尔说。

 下一阶段是让不同课程的软件互动起来,打个比方,若一名工程学学生没弄懂微积分的一个知识点,导致物理学习步履维艰,系统就可以在微积分课程中,找到学生需复习的那部分。

 “教授可能要跟学生谈上半个小时才能弄清楚,学生的问题不在物理,而是微积分。系统却瞬间就能搞定,”布拉克莫尔说。

 亚利桑那州立大学还计划在更多方面使用大数据,包括将学生与大学期间经历过类似困境的学生辅导员配对,并通过系统,将学生的经济条件数据与预测型分析工具相结合。自2006年至今,该校的四年毕业率已经上升了19个百分点。

 使用大数据的并非只有公立研究型院校。塔夫茨大学是波士顿地区的一家私立高校,校长安东尼·摩纳哥(Antony Monaco)表示,数据分析使一家院校更能实现其使命。

 塔夫茨大学经常通过其“院校研究与评估办公室”协调的调查,收集有关学生与教职员工的大量数据。它用这些数据衡量绩效,并与全美及全球其他院校相比较。“要做一件事,你得知道成效如何,”摩纳哥说。“有了数据,你才能衡量你的成绩。”

数博前沿 ▏欧美大学是如何使用大数据的?
 

 比如,塔夫茨检测旗下每个学院的学生多样性。它还使用分析工具,追踪研究产出率;了解研究资金究竟被用在哪些地方;展开内部审计,及时发现潜在作假现象;分析学生对教学的评估,更好地理解教师表现。“数据和仪表盘有助于管理人员、教职员工、受托人和顾问们做出更好的决定,”他说。

 但包括美国的私立和公立高校在内,使用大数据主要还是为了提升学生留存率和通过率,尤其是针对大一新生。戴尔EMC的大数据实践首席技术官比尔·施马佐(Bill Schmarzo)说,归根结底,这都是考虑到财务问题。他也是旧金山大学管理学院研究员,在该校教授大数据方向的MBA课程。

 “大学花很多钱把学生招进来,但要到学生升入更高年级,才能实现财务回报,”他说。

 不同于大学创新联盟,跟施马佐打交道的很多院校都对这方面的做法守口如瓶,说是要保护“商业机密”。不过,他和这些院校一起做过的项目包括:用大数据找出毕业可能性较高的学生,更好地理解校友捐赠情况,以提振捐款额。

 他说,一些高校的终极绝招就是针对毕业后很有可能慷慨回馈母校的人,度身定制录取通知乃至科目和课程。“要是这样做,学生留存率问题就更不可小觑了,因为一旦学生辍学,潜在捐款额也就保不住了。”

 当然,这样使用大数据也不无争议。学生的背景数据影响到其是否被录取,这种做法会让很多人难以接受。但施马佐持相反意见:“藉此,大学可以拓展其在社区和社会中所扮演的角色,比如参照具体兴趣与能力,将拒收的学生推荐给其他也许更合适的教育机构……”比如“职业院校,大专或当地社区学院。也可以确保学生进入适合自己的院校,获得合适的体验。”

 追踪学生的一举一动,这也让人不禁担心:大学会不会变成乔治·奥威尔小说中的“老大哥”。但大学创新联盟执行总监布里奇特·伯恩斯(Bridget Burns)坚持认为,对于这类做法,当代学生已经习以为常。

 “都是大人们在哪儿扭扭捏捏。实际上,这一代人从小就将很多个人数据交给Facebook,”她说。学生付钱给一家公司,就会期待这家公司用他们的数据,确保他们获得最好的服务。她举了个例子,那就是亚马逊的未来购买推荐。学生们“更不希望在没有机构支持的情况下,迷失方向,不知所措。”她总结道。

 但高等教育领域的高级讲师、在新西兰奥塔哥大学研究大数据与学习分析的本·丹尼尔(Ben Daniel)表示,有些学生还是担心隐私与保密性的。他认为,这方面还需要更多的研究,虽然他也指出,在学习分析领域的项目中,大部分的数据都是匿名的,而且,若是以正规方式征求许可,学生通常是愿意提供这些数据的。

 到目前为止,最具争议性的是用大数据管理学业成绩。举个例子,引用量、期刊影响因子,这些数字日益成为衡量研究成果的指标,用来反映研究人员在院校排名和全国性研究评估中,对本校作出的贡献。然而,这些手段仍然极具争议,对于引用量能在多大程度上反映研究的质量与重要性,很多学者都提出了质疑,并敦促管理人员谨慎对待这些指标。对此,拉夫堡大学和巴斯大学等多家院校都作出过回应,声明会负责任地雇佣、提拔与评估员工。

 更令批评人士质疑的,是正在崛起的“另类指标”。比如一篇论文在Twitter上的转推数,或在Facebook上的赞数。有人倡议,另类指标或可以作为学术影响力的早期指标,并反映出研究人员在更大范围内的互动度或冲击力。然而,此类说法依然具有高度的争议性。

 争议较小的是英国高等教育技术机构Jisc正在开发的一个系统。参与开发的还有另外17所高校。该系统可以自动追踪一篇研究发表时,研究人员所出的版面费。Jisc高等教育与学生体验负责人莎拉·戴维斯(Sarah Davies)说,这种全国性的大数据协作在英国颇为典型,在各个领域内都很常见。

 另一个例子是,Jisc正与另一群高校以及高等教育数据机构(Higher Education Statistics Agency;下简称Hesa)合作展开一个项目。该项目用到了英国政府旗下的全国小学生数据库(National Pupil Database),其中包含学业成绩与免费校餐资格等数据。除此之外,Jisc和Hesa还在开发多款工具,它们都将馈入后者的“Heidi Plus”商业智能工具。该工具于2015年启动,已经就学生、教职员工、财务、地产和社群互动等,向用户提供了广泛的数据。它允许院校之间对运营成本、研究收入、员工构成与薪水等事项展开对照。

 Hesa的高校数据收集活动历来都是一年一次,不过未来计划增加这一频率。除了年与年之间的对比,一年之内的对比也将成为可能。而且不仅仅是高校本身,政府、出资人与监管机构也可以使用这些数据。

 Jisc也在致力于一个全英国范围的学习分析系统,各院校可以将自己的系统接入其中。戴维斯说,除了提振毕业率,各院校收集的数以十亿计的数据点有望成为难能可贵的资源,为未来的教育研究作贡献。

 “这可能会革新教育领域,就像大数据革新其他各个学科一样。”她说。

责任编辑:陈近梅

随意打赏

复旦大学大数据科技前沿
提交建议
微信扫一扫,分享给好友吧。