百度、CCF开启NLP竞赛,人工智能正在索引真实世界
3月,百度、中国计算机学会(CCF)举办了“百度杯” 国际自然语言处理与智能分析技术NLP竞赛,而这也是百度与中国计算机学会首次举办的关于NLP领域的技术大赛,并且同时面向海内外选手。这场特殊的比赛代表了百度对未来人工智能的关注重视,以小窥大,百度与中国计算机学会到底看到了怎样的未来?
一、此次竞赛到底有什么不同?
国际自然语言处理与智能分析技术竞赛,这与传统的网络安全竞赛、传统编程竞赛不同,传统的比赛仅专注于技术本身,而NLP旨在让计算机理解自然语言,通过该技术架起现实世界与网络世界的桥梁,而NLP技术也是搜索引擎的立根之本,用户输入相关关键词后,搜索引擎给出答案就是利用到了NLP技术。
此次竞赛的亮点在于将“实体搜索”作为赛题,由百度NLP部门提供相关数据,给出包括“餐厅”、“电影”、“电视剧”、“名人”等这样的实体数据,参赛者通过设计不同算法使得用户搜索相关关键词时可以更加准确地搜索到自己想要的结果,诸如“适合约会环境好的餐厅”,这其中就需要参赛队伍针对“适合约会”和“环境好”进行NLP的各项数据定义,准确、迅速地给出符合描述的最好餐厅。
本次竞赛官方会在3月中旬发布具体数据和规则,并在6月份截止提交。期间,参赛选手及团队有着足够的时间来设计算法,每天最多提交一次结果,根据系统所判成绩,和当前最高成绩比较,从而不断优化算法,最终成绩以比赛截止前最后提交的算法为准,最终由百度技术专家、CCF计算机学会专家、国内外高校相关领域的教授做出评审。
二、NLP技术,如何索引真实世界?
此次NLP技术比赛的重点在于机器对“实体”世界的理解,而这也和百度所看好的未来一致,2015年的百度世界大会上,李彦宏发布了百度人工智能产品“度秘”,这是一款运用到NLP技术的语音交互搜索服务,用户可以通过在手机百度呼叫“度秘”,通过语音或者文字对话的形式可获得相应的服务。而通过“度秘”,用户亦可以进行对真实世界的服务获取。李彦宏也在发布时说到“现在,各类的服务层出不穷,我们看到无论是在教育、医疗、金融或者平时各种各样的日常生活服务领域,都在迅速地实现从线上到线下(O2O)的连接。我们以前说360行,今天我们说它正在裂变成3600行。”而百度发布的“度秘”则是为了应对真实世界对服务需求变化,通过用户与度秘语音形式的交互,最终连接人与服务。
“度秘”作为用户与服务的桥梁,其必然需要用到多方技术,首先是语音技术。 “度秘”基于百度在国际上领先的语音识别技术可以将文字转化为机器所能够理解的需求则需要NLP技术,NLP技术通过各种维度的标签对服务进行建模,最终通过学习与计算为用户找到最符合要求的酒店、餐厅、电影院、电视节目等等。
除此之外,以往的搜索引擎只是停留在用户想要什么信息上,而现在的搜索引擎已经过渡到用户想要怎样的服务,百度旗下的矩阵产品手机百度、百度地图、百度糯米等产品都希望将O2O服务融入其中,而NLP技术则是对这一切整合的最终“破冰”,也是对多模(包括文字、语音、图像等)交互形式的一种探索。用户所有的购买行为背后都隐藏着各种喜好,而NLP中的个性化建模技术则负责理解这种喜好,最终会为用户推荐其最为满意的产品与服务。
三,此次比赛将为高校带来什么?
百度与学术界一直连接紧密,与高校间的合作也从未停止,诸如曾举办过百度西交大大数据竞赛、百度知识图谱大数据竞赛、百度之星编程大赛等技术类竞赛,积累了大量成功经验,此次百度校园与百度自然语言处理部一道,联合中国计算机学会将对高校及学术界带来如下帮助:
1 )促进 NLP 技术研究在高校中的发展, 由于NLP技术属于前沿的技术领域,而实体搜索也是该领域中全新的课题,学术界此前尚未开展此类课题研究,这次比赛则可以让高校看到该前沿技术领域的学术价值,加大对该领域的重视,促进NLP技术研究在高校的普及与发展。
2 )用实际数据协助 NLP 的学术研究, 而该竞赛提供了实际商业运行中的数据,百度所提供的数据均来自于前沿应用所得,有着很强的实用性,这也就让优秀的算法可以真正应用到实际的产品中,让学术成果产生更大的实用价值。
3 )挖掘 NLP 领域优秀人才, 对于尚未踏出高校的学生而言,相比于理论,企业更为需要的是实践经验,而此次的大赛则给了NLP领域的优秀人才机会,所有获奖学生不仅可以获得百度的实习机会,还可以证明自身能力做荣誉背书,有着很强的现实价值。
结语:
当前的搜索引擎已经在解决实际问题,而百度与中国计算机学会共同举办的此次NLP大赛其实侧面反映了索引真实世界服务正在积极的进入联网产品中,任何不被互联的商户和实体在未来都将被淹没,而用户也将越来越依赖基于人工智能的服务。此外,在万物互联的趋势下NLP自然语言处理技术也在变得越来越重要,此次比赛预示着在NLP领域学术界与企业界的结合将越来越紧密。
作者微信公众号:shouxifayanzhe