吴军:Google 中日韩文搜索算法的主要设计者,因《浪潮之巅》享誉业界

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

雷锋网 AI 科技评论按:作为一位计算机科学家,吴军博士有两个最为人所知的身份,一是他是当前 Google 中日韩文搜索算法的主要设计者,曾一度为 Google 贡献了整个代码库 0.7% 的代码;另一是他的作家身份,他在《浪潮之巅》一书中,以对世界 IT 产业高屋建瓴的视角和深入浅出的剖析,而享誉业界。

在 10 月 25 日—27 日杭州国际博览中心(G20 会场)举行的 2018 中国计算机大会(CNCC 2018)上,吴军博士将莅临现场围绕「大数据推动数字经济」这一话题展开演讲。

吴军:Google 中日韩文搜索算法的主要设计者,因《浪潮之巅》享誉业界

吴军博士,是著名自然语言处理和搜索专家,他毕业于清华大学(本科、硕士)和美国约翰·霍普金斯大学(博士),在校期间,吴军博士致力于语音识别、自然语言处理,特别是统计语言模型的研究,曾获得 1995 年全国人机语音智能接口会议的最佳论文奖和 2000 年 Eurospeech 的最佳论文奖。目前,吴军博士已在国内外发表过数十篇论文,并获得和申请了十余项美国和国际专利。

对于吴军博士的身份,需用「多样化」这个词来形容——Google 中日韩文搜索算法的主要设计者、前腾讯搜索业务副总裁、硅谷风险投资人、约翰·霍普金斯大学工学院董事会董事、中国工业和信息化部的专家顾问、创业导师以及畅销书作家等等。

在计算机科学这个领域,相对于其他科学家而言,吴军博士的身份可能会少了些「学术」而多了些「实干」。事实上,对于学术界和工业界的抉择,吴军博士一开始就有了很明确的答案:工业界离人的生活更近。他在人物 LIVE 2016 年的一次采访中表示:「十年前 Google 搜索的老大,现在是美国工程院院士的阿米特辛格和我讲,我们的算法都应该是前所未有的,我们的每一个程序在全世界都有上亿的人在用,我们在创造、在改变世界。」

Google 中日韩文搜索算法的主要设计者

2002 年博士毕业后,吴军博士就加入了 Google,不久后就与 Amit Singhal(美国工程院院士,世界著名搜索专家)、Matt Cutts(Google 反作弊官方发言人)等同事一起开创了网络搜索反作弊的研究领域,并因此获得 Google 工程奖。

2003 年,他又和 Google 全球架构的总工程师朱会灿博士等共同成立了中日韩文搜索部门,成为 Google 中日韩文搜索算法的主要设计者。 之后,他继续领导了许多研发项目,包括许多与中文相关的产品和自然语言处理的项目,得到了公司首席执行官埃里克·施密特的高度评价。

虽然在 2010-2012 年,吴军博士离开 Google,出任腾讯搜索业务的副总裁——此期间还担任国家重大专项「新一代搜索引擎和浏览器」项目的总负责人,然而,也许是吴军博士注定与 Google 有某种难以切割的缘分,2012 年,他又回到 Google,负责开发了 Google 自动回答系统——而他也因为这个项目发现了一片新天地。

根据图灵的观点,当机器可以回答人的问题而提问者无法判定回答问题的是机器还是人时,机器就有了和人同等的智能。这要求计算机不仅能够识别人的语音,还能回答人的提问,但是直到 2012 年,机器自动回答复杂问题(如「为什么」和「怎么办」)在学术界依然被认为是一个尚未解决的难题。

2012 年,吴军博士在 Google 领导的研究小组开始着手解决这个问题,到 2014 年年初,Google 的搜索引擎已经能够回答 30% 的复杂问题了,这远远超过了当时学术界同类研究的水平。 针对这一重大成果,吴军博士在《电信科学》上发表的一篇详细讲述机器智能前世今生与未来影响的综述论文《大数据和机器智能对未来社会的影响》中提到,「除了 Google 在自然语言处理等基础算法上做到了世界领先之外,更重要的是 Google 将这个过去认为是自然语言理解的问题变成了一个大数据的问题。」

另外,值得一提的是,在 Google 任职期间,吴军博士顶峰时期写的代码一度占 Google 整个代码库的 0.7%——对于绝大部分 Google 的工程师来说,这是个难以超越的数字。

曾渴望用算法和代码屹立世界之巅,如今选择用文字去影响世界

而跨界成为作家这一事情,则颇有些阴差阳错的意味。吴军博士表示:「我没有作家梦,要说是什么原因导致,就是一开始我写黑板报,写完以后很受欢迎,就接着写下去了。」

2007 年,时任 Google 资深研究员的吴军博士,应邀为 Google 黑板报撰写文章,随后 Google 黑板报人气大增,拥有了大批追随者。

李开复便是其中的追随者之一,他对吴军博士做出了非常高的评价: 「在我认识的顶尖研究员和工程师里,吴军是极少数具有强大叙事能力和对科技、信息领域的发展变化有很深的纵向洞察力,并能有效归纳总结的人之一。」

此后,他为 Google 黑板报撰写的内容汇集成了两本书:《浪潮之巅》和《数学之美》。《浪潮之巅》以对世界 IT 产业高屋建瓴的视角和深入浅出的剖析,引发了 IT 人员对 IT 产业的深层思考,被誉为 「在这个数字时代,一本 IT 人非读不可,而非 IT 人也应该拜读的作品」 ,并且荣获了「蓝狮子 2011 年十大极佳商业图书」奖;《数学之美》则把高深的原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力,该书荣获国家图书馆第八届文津图书奖以及第五届中华优秀出版物奖。此外, 吴军博士也因《浪潮之巅》被 CSDN、《程序员》杂志评选为 2011 年度十大最具技术影响力人物之一,享誉业界

曾渴望用算法和代码屹立世界之巅的吴军博士,如今则选择用文字来影响世界。《浪潮之巅》和《数学之美》之后,吴军博士又基本以每年一本的节奏出版了《文明之光》(被评为 2014 年「中国好书」)、《硅谷之谜》、《大学之路》、《智能时代》、《见识》等图书,在「豆瓣网」上,本本评分都在 8.4 分以上,其中,《浪潮之巅》和《文明之光》更是高达 9.3 分和 9.0 分。

而在《文明之光》中,吴军博士则表达了对科技和人文的深刻认识。他在书中表示:「它们不是排斥的关系,只是看问题的不同侧面。从历史上讲,科学与人文都是在早期反对宗教、反对神学的基础上发展起来的。科技是唯一一个后人可以做得比前人好的东西,这是大家公认的——可以说,人类之所以能不断进步,动力就源于一些基本的发明创造、科技进步。但另一方面,科学只是工具,不是目的,它不能解决所有的问题,而人文则在文明中起到决定性作用,它决定了文明发展的方向。」

在 CNCC 2018 大会现场,我们将荣幸在现场聆听吴军博士表达更多关于对大数据和科技的见解,雷锋网 AI 科技评论将第一时间为大家带来最新报道。

更多讲者信息及议程,欢迎移步 CNCC 2018 大会官网了解,大会现已开放购票渠道,在 9 月 21 日之前完成报名即可享受优惠。

大会官网: http://cncc.ccf.org.cn/

雷锋网(公众号:雷锋网 (公众号:雷锋网) )AI科技评论整理分享。

转载须知。


吴军:Google 中日韩文搜索算法的主要设计者,因《浪潮之巅》享誉业界

随意打赏

谷歌google搜索google搜索入口google图片搜索google搜索技巧google搜索主页google搜索引擎浪潮之巅 吴军
提交建议
微信扫一扫,分享给好友吧。