参加高考月阅卷的人工智能机器人
小白不菜
小白不菜
微信号xiaobaibucai521
功能介绍我们是小白,但我们不是菜鸟。杨姐告诉你我们应该知道、有权知道、必须知道的事。我们的口号:一定要幸福!
【听杨姐说】
今日重点:
第一,高考机器阅卷靠谱么?机器人答题——能考上大学么?
第二,科学家让考试和阅卷两件事都用机器人干了,以后高考这事还跟人类有关么,会不会变成了机器人之间的自娱自乐?
第二,同样是受邀参加“科技三会”,为啥华为任正非说“前途茫茫”?而科大讯飞则提出要进入新的阶段?
(这里需要澄清一下,人工智能和智能机器人并不相同,人工智能是个系统,但是智能机器人是一个硬件。不过本文中说的“阅卷机器人”,其实是指前者,是具有阅卷能力的系统,并不是硬件上的机器人。)
来,开始跟姐一起烧脑吧:
———————————————————
今天高考!这种折磨人的事,绝对是中国特色。
学生们绞尽脑汁,身心受虐,其实也不仅仅是学生,老师们也头痛——孩子们写出来,就得有人判啊!记得当年杨姐上学的时候,被选中阅卷的老师也是一肚子不开森,因为他们也相当于被关了N多天的“监狱”……不过以后会出现一种奇葩的状况:机器人阅卷!
其实业内早有消息:科大讯飞牵头搞的一个国家项目 ——国产高考机器人,要在2020年考上重点大学,甚至清华、北大!(杨姐独家消息,最近已经开始测试了)!而去年讯飞就已经搞出了阅卷机器人!
艾玛,这是要把人类排除在考试之外颠覆国子监的意思么?话说,以后要是高考这事机器人都能给办了,咱们每个考生都买个机器人,不,还是“租”个机器人替考吧,一辈子就用一次,使用频率过低还是租得划算,而且这玩意估计也跟APP似的升级很快……这不是一门很好的生意么……嘿嘿嘿,做梦吧!
首先要给大家拎拎清楚:这个考试机器人其实并不是为了考试——我个人的理解,之所以要做考试机器人,其实是为了训练系统达到人工智能的一个新的阶段。而做阅卷机器人,则是一个到了更加实用的目的:减轻阅卷老师们的负担!
先搞出来的阅卷机器人,其实是国家863的大项目“类人智能”中包含的一个技术——“机器阅卷技术”,不过牵头负责人都是科大讯飞的轮值总裁胡郁,凭借在人工智能领域的突出贡献,他刚刚在全国科技创新大会上获得了“中国优秀青年科技人才奖”,全国只有十个人哦。
为了搞明白,俺又骚扰了这位博导,胡郁告诉杨姐,此前安徽省合肥市和安庆市的会考中,英文和中文的考试已经全部使用了整套感知智能和认知智能技术进行自动评分,而且效果非常好,以后这门技术将会被全面推广到包括文科和理科的所有课程。
好吧,那么以后亿万考生的人生命运就交给机器了?这玩意靠谱么?什么原理啊?
“矛”与“盾”
给大家分享一下我从胡郁那里得到的信息。
首先讲讲高考机器人,这个项目官方的名字是“基于大数据的类人智能关键技术与系统”,是由国家科技部批复的重点项目,科大讯飞作为项目牵头单位,讯飞的副总裁兼研究院院长胡郁也是这个项目的首席科学家,与清华大学、中科院自动化所、北京大学、北京理工大学、中科院软件所三四十家单位共同负责研发与实施。
这里牵扯到一个问题,为什么要让机器人参加高考呢?
我自己理解,评判一个人智商的标准就是让你参加考试,虽然这个方法很多人都在批判,但是没有其它更好的办法。所以,这是人工智能水平的一个标志,根据大数据来研究相关类脑计算关键技术和类人答题系统——大家想想,如果一个机器人能够参加高考并考取大学,是不是在一定程度上说明其智力水平跟大学生差不多了?
另外,国外也是这么做的啊——美国华盛顿图灵中心在研究如何让机器人通过美国高中生物测试。日本国立情报研究所在研发能够考上东京大学的高考机器人
当然,高考机器人现在还在实验阶段,但是“阅卷机器人”则已经可以上岗了!
这种阅卷机器人用的是另一种技术:“机器智能阅卷技术”,去年年底就已经在安庆、合肥、湖南等地成功试点应用,且经过对人机评分结果的分析,计算机在评分一致率、平均分差、相关度以及与仲裁分更接近的比例等指标方面都已达到或超过人工评分水平……
今年高考不知道会不会用这种阅卷机器人……嘿嘿嘿
这意味着,高考阅卷老师可以下岗了么——绝不是! 怎么可能呢,机器阅卷并不能取代老师审美,而是辅助。
例如目前的高考阅卷,有三道环节,假设每道环节都需要两个老师,一份试卷就需要6个。那机器学会了阅卷之后,就可以在一个环节减少老师的工作量;再例如原来需要两个老师阅卷的,现在就可以采用1个老师+1个机器的方式;或者是有一个环节用机器,人类最终复审。
这样总体下来,会为阅卷减轻了很多工作量。在某方面说,也是更公平,更客观。因为机器是不会疲劳且完全统一标准,而人类还有可能因为疲劳出现误判——听着是不是有点像无人汽车反而比人类开车更安全的逻辑?因为人类司机还有打盹、疲劳等等导致车祸发生的因素,而无人驾驶汽车却没有这些因素。
机器辅助人类,就是用高考老师阅卷的标准来让机器可以辅助老师,减少一定的人力。如果真的是特别优秀的文章,依然可以脱颖而出。这个技术我记得是哈工大讯飞联合实验室研发的!
好,为什么在人工智能领域里,这个很重要呢——这牵扯到了机器阅卷和答题的原理问题。
机器会不会胡判?
一个非常非常让我担心的问题是,机器能判得准么?误判了咋办?机器能像人一样思考么?机器能“读懂”感情么?
根据胡郁的解释是,其实所有的考卷就两部分:客观题和主观题。客观题用答题卡+扫描仪的方式来解决,那效果简直就是:多快好省——阅卷量多,阅读速度快,判卷效果好准确,还省人力。而主观题,其实机器也能干。
其实,美国的MBA、托福考试中早就应用自动批改系统:什么E-rater系统等等。但是,不管是E-rater还是国内的一些研究,大部分针对的都是第二语言作文,即非母语作文。
非母语作文的特点是,学生的错误大多是一些基础性的拼写、语法方面的初级错误,这些错误是比较容易确立一个规则并让机器执行和批阅。而要想机器阅卷技术真正普及并为阅卷工作带来便利,无法回避的一个难关就是:批阅学生用母语写的作文。
与第二语言作文不同,中学生母语作文中基本很少犯语言基础性错误,需要在更高层次,比如作文的文采、篇章的衔接、作文立意等方面做出评判。 那么面对这些主观性很强的文本,应该从哪些维度去评判,又如何去量化这些维度呢?
胡郁表示,其实,人工智能解决这个问题的思路很简单:学习人类!!!
老师判作文咋整?肯定有几个标准对吧—— 同理,想让机器批阅作文,最重要的也是让机器学到这套标准,然后按标准批阅。 比如说,字迹工整程度、词汇丰富性、句子通顺度、文采、篇章结构、立意等多个层次。再比如,判断一篇作文是否离题,首先需要根据题目内容提取关键词,并根据主题进行扩展,同时提取作文的关键词,计算作文的关键词和题目的关键词的相似度。而把握一篇文章的立意,就要通过“人工神经网络”来实现……
这个技术有个自己的名字:讯飞作文评分系统!关键的地方在与,不仅仅是评分,还可以自动生成“评语”——觉不觉得人工智能有点牛得让人觉得“瘆得慌”?嘿嘿嘿
但是吧,我觉得这个系统现在还差一个部分,就是“情感维度”——有的时候一篇文章能够用事实来感动人,而不是华丽的辞藻等等……所以,我觉得,人工智能永远只能是咱们人类的辅助……
迷茫和空间
首先说个问题,关于人工智能,几天前任正非任总在全国科技创新大会上的公开讲话中提到:“华为现在的水平尚停留在工程数学、物理算法等工程科学的创新层面,尚未真正进入基础理论研究。随着逐步逼近香农定理、摩尔定律的极限,而对大流量、低时延的理论还未创造出来,华为已感到前途茫茫,找不到方向。华为已前进在迷航中。”
对于未来,任正非的预判是,未来二、三十年人类社会将演变成智能社会,深度和广度还想象不到。但对于现状,任正非直指华为目前“很迷茫”,攻入无人区后,逐渐陷入了无人领航、无既定规则、无人跟随的困境——尽管他认为打破困境的方法是坚持科技创新,追求重大创新,同时内生与外引相结合。
胡郁认为,任正非任总的这种“迷茫”其实是有背景的,他不是单纯在讲人工智能。华为是在通讯工程系统,在他的那个行业领域里,法则就是香农定理、摩尔定律这样的硬指标。而当这些定理、定律理论基础没有发展的时候,实体就很难突破。加上华为本来的水平就已经很高了……其实任总还是比较谦虚的。
在胡郁看来,目前中国的人工智能研究还处于跟随的位置,但是在跟随战略中又有自己的特色。
事实上,中国在人工智能领域能做的事还很多——理论尚有巨大的空间尚未实践完毕,且中国在移动互联网时代已经走在了世界的前列,包括大数据等方面,中国已经有了很长一段时间的积累。
这会是中国在人工智能方面超越先进国家的开始么——或许吧,无论如何,要做人工智能就要首先识别对方的语言吧,中国那么多方言,老外是一时半会绝对学部会滴……
对不对?
————喜欢吃面包的分割线————
【小白不菜】微信号:xiaobaibucai521
我们是小白,但我们不是菜鸟!
荣获2014年最佳自媒体
媒体训练营2014最佳自媒体
百度知道认证专家
2015媒体训练营年度媒体之星
您可以在百度百家、今日头条、QQ公众账号、腾讯新闻客户端、网易新闻客户端、网易云阅读……等平台同时阅读,您还可以在领先的“蜻蜓FM”上“听”到这些精彩内容
小白不菜是宇宙第一自媒体联盟WeMedia成员。