高考上演“人机争霸赛”,人工智能+教育能跑出几家?
2017年6月7日,高考机器人AI-MATHS和Aidam分别在成都和北京参加了数学考试,并分别在22分钟、7分49秒的时间内获得了105分、134分的成绩。
自高考机器人参加高考并取成绩后,引起了学术界、教育行业内、技术界的热烈讨论,但同时“高考机器人是一个噱头”、“高考机器人单一产品落地产品是有困难的”、“很难说有没有作弊,不过确实不能拿几个简单的问句来解释。”等争议和质疑不断。
教育圈被机器人之战持续刷屏。面对高考Pk赛的热浪来临,在人工智能技术与现有教育行业方兴未艾之际,同时也伴随着社会的部分质疑,是概念炒作还是技术壁垒?
面对人工智能技术的“霸气入侵”,上市公司和创业公司是如何分羹的?如何在“人工智能+教育”领域跑出,而非跑死?
题库、逻辑推论,高考机器人原理各有不同
根据公开信息显示,此次两个高考机器人在采用的原理和逻辑各有不同。
6月7日,成都准星云学人工智能系统“准星数学高考机器人”AI-MATHS参加2017高考数学考试,在22分钟的时间里,得分105分。整个过程是严格按照断网、断库、自然语言理解、综合复杂推理等严格流程进行的公开透明测试。
其通过智能笔,能识别答题过程,判断对错。虽然外观上与普通笔无异,但通过其前端的红外线摄像头,配合点阵纸,可探测使用者落笔的位置进行数据采集并上传,再通过构建的数据库(数学公式、汉字、符号和语境四大数据库)进行后面的纠错解答,以及评测。虽然考试机器人的水平很高,但实际上,考试机器人自身亦存在缺陷。
其在2017年2月,准星的“高考机器人”进行过中期评测,得分93分,败给了43名文科班学生。3个月后,机器人在复杂逻辑推理、直觉观察推理、计算机算法、深度学习上都进行了深入攻关。
成都准星云学创始人、清华大学苏州研究院大数据处理中心负责人林辉表示,“高考机器人”已经练习了1.2万道题。“高考机器人”没有题库,“它是通过综合逻辑推理平台来解题,而非学习储存题库。”
他认为,在此前的评测中,机器人也曾达到过110分以上,但并不稳定,且要看试卷的匹配度。此前失利,“高考机器人”在不会的题目中错过了很多步骤分,“现在设定,比如一道题目不会,多少分钟后就跳过;也可以在会的范围内得步骤分,不会留一个空白。”据说,机器人约20分钟就能答完一套题。
对于另一个高考机器人Aidam,学霸君首席科学家陈锐锋描述解题过程,一是将自然语言转化为形式语言;二是做解题;三是将形式语言转化为自然语言做输出。在机器解题上,Aidam分为三个步骤,第一步是通过句法解构、算式解构和主谓宾解构,转译为机器能看懂的语言,从而让机器读懂题目。第二步是激活神经元之间的连接,机器通过自动证明和推理,得出解题结果,第三步是将解题步骤和结果翻译为人类语言,展示给学生和老师。
通过两者的对比,一个是国家的“863”项目,另一个是社会项目;一个是在断网断库情景下,另一个是在联网联库情景下。两者都是将有强逻辑知识点的数学科目切入,数学、物理等理科类科目是强逻辑链路的,考点基本稳点。
只不过,两者在技术的方法论上有所不同,前者是综合逻辑推理平台来解题,后者是基于学习存储题库进行运算和输出。
炒作OR技术壁垒,质疑源于何处?
在知乎上,有人犀利地提出疑问,“AIDAM是人工输入题目,那还做个什么人工智能?”、“作为NLP的从业人员,很担心最后AI领域被他们玩坏,进入冬天了咋整。”等等。
面对不同的讨论和质疑声,蓝鲸教育向有关图像识别、深度学习、文字识别等专业方向的人工智能专家进行了解,并得到了各自的看法和观点。
有业内人士苗广艺在知乎上表示,对于一家商业机构并刚过C轮的创业公司来说,不同于为了拿学术地位的科研机构,也不是手握印钞机开始考虑技术影响力的巨头。自动解题技术花费了公司大量成本,现阶段不会直接公开出来。如果业务已经形成一定垄断,技术公开就很轻松了。而现在,技术是护城河之一。
其次,整个流程没有动手脚。过程是:第一时间拿到高考试卷(拍照的图片),然后录入到电脑上(内容和试卷一模一样,公式用的latex格式;人没有做任何翻译或预处理,后面的NLP完全是由系统算法自己做的),然后把题目数据输入到解题系统,系统自动解出所有题目(没有任何人工),然后输出表达成解题的步骤(也是自动的),最后第三方老师拿到这些步骤开始批改,给出客观分数。这是一个系统工程,用到很多人工智能的基础算法,但不是通用算法的简单训练,是垂直领域的深度加工。
中科视拓CEO、深度学习大讲堂执行主编刘昕博士向蓝鲸教育给出了他的思考,两者是要做两方面一方面从感知的角度是要从图像转向文本或者转向符号,要先做感知;另一个方面是要做语义理解。即从图像到数字化、并从数字化内容进行理解;需要有试题等历史积累。
刘昕同时表示,第一方面体现的是数据问题,通过大量的高考数据进行学习;第二方面体现的是在做完数字化之后,要理解内容,比如阅读理解和问答题等在说什么,需要有一个数据库。有两个途径,一个是完全的数据驱动,通过统计数据的方法或者规律说明数据的意思;第二个是有人类知识的经验或者逻辑的经验。
东南大学人工智能专业教授漆桂林先蓝鲸教育表示,高考机器人要落地现在还很难,但是其可以做的一个事情就是减少人工回答问题的工作量 。比如说,以前需要很多人工回答的问题,可以由机器给出一部分的答案,当然,必须保证答案的正确性。
上市公司和创业公司如何分羹?
在 科大讯飞公司轮值总裁吴晓如看来,让人工智能去参加测试的主要目的就是要看看机器能达到一个什么样的人工智能水平 ,而随着后台海量数据库的增长,传统的“图灵测试”已经无法完全衡量人工智能的水平了。而 高考是一种很好的,可以作为衡量人的知识水平、理解能力、推理能力等相关智能能力水平的测试工具 ,所以这个才是他们把高考作为这个项目主要目标的原因。
目前,已经有科大讯飞、网龙华渔、淸睿教育等上市公司以“人工智能+教育”作为主要的业务发展思路。蓝鲸教育对涉及高考机器人、作文批改、语言测评等10家公司进行不完全统计,从产品、商业模式和业务方面做对比分析。
图解1:涉及高考机器人、作文批改、语言测评的上市公司的不完全统计
蓝鲸教育发现,目前有A股的科大讯飞、新三板的清睿教育、港股网龙等三家上市公司。
科大讯飞专业从事智能语音及语言技术、人工智能技术研究和软、硬件应用开发等。 在高考机器人方面,科大讯飞是从语文科目切入,不过最后的结果目前没有对外明确披露 。
科大讯飞2016年8月宣布投入十亿元,推动其智慧课堂等教育产品进入1000所名校。“智慧课堂”是科大讯飞的核心教育产品,依托大数据和人工智能等信息技术,其实质是基于动态学习数据分析和“云、网、端”的运用,真正实现教学决策数据化、评价反馈即时化、交流互动立体化、资源推送智能化,创设有利于协作交流和意义建构的学习环境。
截至今年3月,智慧课堂已在北京、上海、广东等10几个省份得到应用,累计服务考生人数突破1700万。此外,这个技术也被用于普通话水平等级评测中,考试机测人数已达550万,累计机测人数2600万。
科大讯飞正积极打造教育业务产业生态链,并将构建从国家到各省市区县,再到学校课堂以及家庭的产品体系。未来要将科大讯飞华南公司打造成为成熟的项目样板基地。
自2015年开始, 网龙在中国大陆主要产生了两次涉及“AI+教育”的投融资 :一次是全资收购了与科大讯飞一样以语音识别为主营业务的驰声科技,其于2014年从思必驰原口语教育事业部剥离成立;主要应用于教育领域的语音技术服务,拥有自主知识产权的发音评测、有限分支语音识别、表达能力评估等语音技术。评测技术支持中英文的字、词、句、段落发音评分,以及看图说话、故事复述等题型,可以实现多维度跨平台自动化机器评分。第二次是在2015年6月参与了学霸君的B轮融资。
清睿教育成立于2011年,旗下核心产品——口语100采用了第三层人工智能技术感知心理声学,准确率高达96%。其采取典型的B2B2C模式,产品先免费给学校,再吸引C端用户。这种模式对产品本身的要求很高,清睿教育教育董事长朱奇峰向蓝鲸教育表示,目前口语100的转化率高达10%。注册用户超过1300万,覆盖全国13000多所学校。
图解2、3、4、5:涉及高考机器人、语言测评等人工智能技术的非上市公司的不完全统计
根据公开数据的不完全统计,盘点了6家为创业公司,其中猿辅导进入了E轮,获得1.2亿美元的融资;学霸君为C轮公司,乂学教育、准星云学为A轮公司。科大讯飞的高考机器人是从语文学科切入,而本次的学霸君和准星云学的高考机器人是从数学学科切入。
成立于2013年6月的学霸君已获得C轮1亿美元融资,以开发的拍照答题切入教育行业,专门为初高中生提供在线免费解答作业题、疑难点等服务。学霸君主要做图像识别、自然语言理解、深度学习等人工智能领域的研究,并整合成为智能教育机器人。陈锐锋曾在论坛上向蓝鲸教育表示,目前学霸君APP已经积累超7000万用户,累计解决近100亿个问题。
此次热潮下的另一家高考机器人公司,准星云学成立于2014年,核心技术团队由中国科学院院士、国际知名计算机专家、海归精英及博导组成。其研发的准星云学研发的高考机器人暨“准星智能评测及学习平台”拥有自主知识产权的自动解题技术,核心技术集成了多项前沿技术,形成了复杂逻辑推理引擎平台。核心团队参与并主导了国家863课题《基于大数据的类人智能关键技术与系统》中的子课题《初等数学问题求解关键技术及系统》(即数学高考机器人)。公司目前已申报发明专利40多项。
乂学教育在天使轮已获得1.2亿元融资,以线上线下两线齐头并进的模式。线上的模式和51talk,VIPABC类似,是由学生直接在线上完成授课。不同的是,乂学教育30%由老师完成,70%是由人工智能的系统完成。线下业务以加盟的形式,在各地开实体授权学校,线下招生,目前已经有100多家,已经开业的60多家。产品方面,目前只做语数外三科,而且只涉及初中阶段,今年会迅速补齐其他几科,并尽快往高中和小学阶段发展。目前覆盖到浙江、江苏、山东、湖南等地,主要集中在省会城市和经济发达的地市级城市。
通过不完全统计,蓝鲸教育发现,在Pk热潮之前,中国上市公司和非上市公司已经在人工智能+教育领域,受到资本和C段用户的青睐。在一些部分公司中,技术有一个大幅的提升,在某些教育细分中也开始了一定规模的商业化, 大多是以直接ToC为主 。
科大讯飞、网龙等上市公司除了自身技术研发之外,也不排除收购的“人工智能+教育”的创业公司;在投融资方面,腾讯、新东方、网龙、阿里系的湖畔基金也积极投资,总额近亿元人民币。
热潮之下,教育企业如何打出一副好牌?
这个看上去很美的领域其实也面临很大的挑战,就是资本。资本关注主要教育企业的成本,甚至是考虑企业的覆盖面和渠道;出现行业的筛选的机制时,资本很可能是其中最大的力量。AI技术已经在中国发展迅猛,很多时候资金是重中之重。
目前,已有两家高考机器人进行了人机争霸赛,那么热潮之下是否会出现高考机器人热潮呢?高考机器人的研发与应用又有什么意义?
移动互联网教育产业基金创始合伙人 尉迟道坤认为,高考机器人能在多大程度上落地值得商榷,像有的互联网巨头也在投入巨额资金做人工智能,但是离社会化应用和行业应用还有很长的路要走。更不要借用“高考机器人”和机器人可以考上一本的噱头去迎合部分人心理,机器永远适应不了原创题高考的选拔性考试 。
而中央电教馆移动项目专家马永纪指出,通过两个高考机器人的技术和结果的对比,对教育公司有一定的启发意义。行业中众多公司追求“皇冠上的明珠”,公司要打出一副好牌,重点应该关注其在探究学生的学习能力、学习逻辑、传授知识等方面的科技实力及研发实力。 他指出,未来“跑出来”的教育公司可能不仅仅于学霸君和准星云学,“跑死”的公司也可能不排除这两家;毕竟还有重量级“选手”没有参与到此次的“争霸赛”中 。
从AlphaGo到高考机器人,人工智能似乎更加“接地气”了,人工智能在教育里的影响已经十分深入,那么未来人工智能+教育会跑出“独角兽”企业吗?一位教育科技企业的工作人员表示,短时间之内不会出现“独角兽”,不过未来肯定会出现一定的技术优势的企业,拥有技术壁垒和数据的企业势必就是“独角兽”企业。
在清睿教育创始人朱奇峰看来,“ 靠技术成为独角兽大概都有以下四个特征 :第一,技术要有足够的壁垒,否则再好的东西一大堆人会扑上来。第二目标市场要足够大容得下独角兽的成长。第三,技术跟教育的结合能力非常强,单纯的基础如果不能跟教育深度结合都是不够的。第四,上面三项在早期都是很难判断的,所以还需要加上一个第四,就是 至少在市场上得到验证;付费上亿,这样市值首先得达到十亿,然后看看有没至少要有一个终端用户为之有在增长十倍的可能性才能判断是不是独角兽。 ”
常春藤投资基金经理张家钢指出,创业本身就是九死一生,最重要的是看中创始人的背景;其次,既然是人工智能,其偏爱于背后有大量数据的公司。
这一观点同样得到了中科视拓CEO刘昕的认同,在他看来,未来是数据驱动和人类知识经验或逻辑经验的融合。要考虑到人类的经验,要从海量的数据分工中去学习知识。他认为,未来5年之内会出现独角兽公司,尤其是技术答题精度和效果足够高的公司。同时,在学科支持方面,独角兽公司涉及 学科要足够的丰富 ,如数学、英语、物流和化学等不同学科。不过, 他也认为,如果仅仅是突破单一学科的“独角兽”公司有相对较短的时间内产生 。
刘昕解释到,目前人工智能技术与NLP技术的结合不是不能阻挡的趋势,正在打通计算机视觉技术与自然语言技术的打通;未来的趋势之一一定是计算机视觉技术与NLB技术的结合;而且,两者的结合在5年内对突破人类顶级教师的能力是可以预期的,类似于Alpha Go 。
结语: “柯洁大战阿尔法狗”,到“机器人参加高考”,人工智能不仅在改变我们认知、探索世界的方式,更在改变世界。
从发展趋势来看,今后教育活动中势必会有越来越多人工智能的身影:它可以作为助教或家教老师,为孩子们提供实时反馈和答疑服务,有不会的问题,请直接问;在教学中,人工智能已具备图像识别和语义分析技术,或许过不了多久就能帮老师批改作业和答卷,减轻老师的负担;如果想得再远一点,人工智能或许有助于增加优质教育资源的供给,让更多孩子享受“名师”服务。
而今天的机器人参加高考考试说明了在考试、教育领域应用的新突破,并没有多大意义,毕竟考试并不是AI应该聚焦的目标。涉及人工智能技术的教育企业的目光应该聚焦在更长远的地方、聚焦在真正智能的项目上。“否则,最终的结果就是, 机器通过了考试,但是你却只触摸到了理解的皮毛。 ”