【首发】考拉阅读获3000万 Pre-A轮融资,要用中文阅读分级系统为孩子匹配最适合书籍
近日,猎云网
曾报道过的考拉阅读
向猎云网透露,他们于近日完成3000万Pre-A轮融资,清科基金领投,真格基金和伽利略资本增持。据悉,此轮融资将主要用于底层人工智能技术的进一步深耕以及产品的升级上。
写进国家战略的“阅读”目标
“个体阅读能力的差异与海量难度不一的图书之间链接的断层,让孩子读什么、怎么读的问题始终困扰着家长和老师。”CEO赵梓淳说。
在国外,文本阅读分级的思想和产品已形成成熟的体系,分级阅读已覆盖了美国90%的学校。主流的分级系统蓝思分级和GE分级测评体系的科学性和效率都已经得到了市场的认可,许多科技公司也应运而生,包括通过分级阅读和数据分析,创建适于每个学生阅读能力的个人图书馆的产品,Lightsail和将新闻聚合并分级,为不同阅读水平的学生提供时事新闻的产品,Newsela等。
在国内,目前,国家政策已经确立了关于国家语言文字事业十三五规划,同时“阅读”一项重要的教育素质,也已被划入义务教育的阶段性目标中。语文教学被放在了越来越重要的地位上。
但是,由于实施义务教育阶段课程标准无与之匹配的阅读体系与评价体系,校园分级图书不能满足学生个体的阅读需求,使得阅读在教育领域的推广始终面临着巨大的挑战。同时,缺乏合理的阅读训练方式和阅读推荐也导致中国儿童阅读兴趣难以调动,结构不均,成长性不足的问题。如何解决这些问题,是摆在整个教育事业面前的巨大挑战。
适于中文语言的分级标准
“我们希望打造的是最适合中国人的阅读分级标准。”CEO赵梓淳说。
考拉阅读是以享阅中文分级标准(ER Framework)为依托、针对于K12的分级阅读产品,可以根据学生的阅读能力推荐适合的读物,并提供全方面的阅读数据监控与分析。
考拉阅读团队的成员
由于打造中文分级标准和自适应学习系统的存在很大难度,因此,在创建中国本土化的阅读分级体系的时候,享阅教育组建了一支 “高学历+经验”的核心技术团队:享阅教育的CTO任易是北京大学数据挖掘方向的博士,曾在IBM中国研发中心Waston for Life Service和搜狐大数据中心工作;首席科学家Jake Zhao曾在Facebook从事研究工作,师从于机器学习顶尖学者、深度学习的奠基人之一Yann LeCun教授;CPO苏隽琪则毕业于斯坦福大学,曾经是美国Google 总部search infrastructure team的产品经理;首席语言学家李轩则为香港中文大学的语言学博士。
此外,享阅教育还打造了一只由顶尖语文教研员和语言学家,心理学家组成的教研团队。目前,已经与北京大学机器学习实验室和纽约大学Courant研究院CILVRLab实验室进行了合作,共同研发ER Framework(享阅中文分级标准)。
据了解,目前,在团队的努力下,享阅教育已构建起属于自己的中文分级标准的基本框架。在中文领域,将相关语言学知识通过数字化AI 系统进行拟合。按照中文语言各单位层级的构成规律,提取出了语义逻辑,嵌套深度、信息熵等十几个特征作为模型分级的基本思路架构,对文本进行多维度的信息提取。
CEO赵梓淳介绍,以“词”这个大的维度为例,具体细分为词类、构造(词的组合能力)、透明度(词义可从构成要素的意义上推知的难易度,从透明到隐晦,难度逐渐增加)和抽象性(与词义的具体化相对应)四重特征。
为孩子匹配最适合的书籍
“从阅读材料和读者能力两个方面对数据进行测评,可以更加精确的结合孩子真实的阅读能力,为其匹配最合适的书籍,也能在可控的分数范围内,挑战孩子的阅读能力。”
考拉阅读获得OTEC海外学人创业大赛国内组第一名
考拉阅读把读者的阅读能力和文本难度划分到同一标准范围之内,二者范围都在200ER—1300ER之间。测量结果涵盖两个方面,一是对阅读材料难度的划分;二是对读者本身能力的评估,目前,效度和信度经过大量的实证性研究已经比较理想。
产品从ER文本分级和ER 能力分级两个两项分别切入。在阅读材料的评级上,通过对文本进行各维度的信息提取,将文字以数字化的形式呈现,进而通过数据挖掘,将文本进行难度分类或聚类;在语言学和教育学的专家进行过人工评审的基础上,借由深度学习算法,进一步精确数据匹配的精确程度。
在对读者本身能力的评估的打造上,每一篇阅读材料之后都会附有阅读理解的小测试,孩子们能够通过完成测试题目,自主检测自己对该级别难度文章的理解程度,从而测算出孩子真正的阅读水平。在此基础上,孩子可以更精准的搜寻到真正匹配自己阅读能力的文本。
走进学校
“家长和老师,很多时候有两个疑惑,一是到底给孩子读什么书;二是孩子阅读的完成程度到底如何。”CEO赵梓淳说。
基于享阅中文分级系统(ER Framework),考拉阅读打造了面向校园的分级阅读产品。该平台分为学生端、教师端和校长端。学生在使用的时候,可以在平台上进行阅读能力自测,在可控分数内进行阅读能力的提升训练;对于教师而言,可以通过平台发布阅读任务并跟踪学生阅读进度;同时平台还为校长提供校级阅读数据报告与学习情况管理的便利。
考拉阅读教师端中文分级阅读能力测评报告页面
据了解,考拉阅读目前目前已经与两百余所小学建立了合作关系,在短期内,考拉阅读计划走进更多的学校,覆盖一到三线的10个合作示范区市,600多所试点学校,让更多的孩子能够体验到阅读分级系统和产品对语文学习的助力。
同时,考拉阅读已初步建立起面向学生的阅读书籍库,收录及分级的书本数量达10000+,但是现阶段仍只支持线下阅读,在线阅读的功能目前正在开展大型的出版社合作,在未来进一步打通。