Andrew Ng加盟,百度得到了什么?
传言数日之后,一桩震动全球科技业界的人事任命终于在今天正式得到确认:百度官方宣布,任命吴恩达(Andrew Ng)为首席科学家,全面负责百度研究院。
吴恩达何许人也?在此之前,他广为人知的身份是在线公开课程项目Coursera的联合创始人;在短短两年时间里,Coursera已成为全球最著名的在线教育品牌,拥有超过100所高校的600余门课程,用户达到710万。
但对于百度而言,吴恩达更大的价值在于他的另一个身份——著名人工智能科学家。他是斯坦福大学计算机科学教授及斯坦福人工智能实验室的负责人;2011年,他加盟Google并创立了“Google大脑”项目,因此也被誉为“Google大脑之父”。
在Google任职期间,吴恩达最为人熟知的成就是一个“找猫”的实验。他和Jeff Dean带领的团队从Youtube上随机截取1000万张静态图片,对一个由1000台计算机、16000个处理器的系统进行近一周的“训练”,让它从中寻找出有猫的图片;这个系统最终识别出了超过2万个物体类别(猫是其中之一),识别的准确率达到了15.8%——这看似不是一个很好的成绩,但与此前的水平相比,提升幅度高达70%。
吴恩达的团队将这个实验的成果拍成了一段视频,放在了Youtube上,并迅速成为热门;正是这段视频让许多非专业人士了解了后来异常火爆的深度学习算法的作用。也因此,虽然多伦多大学计算机学院的教授杰弗里•辛顿被业内人士认为是对深度学习影响最大的人物,但如今提起深度学习,不少人首先联想到的却是吴恩达。
简而言之,深度学习是一种对七层或更多层的人工神经网络进行训练,使计算机能够渐进学习的一种算法;随着层次的增加,学习的精确性得到提升,同时该技术还极大地推动非监督学习的发展,让机器具备“自学”的能力。
深度学习在过去两年中的火爆,百度同样功不可没;事实上深度学习也是将百度和吴恩达联系在一起的重要因素。去年1月,李彦宏宣布百度将成立首个研究院——百度深度学习研究院(IDL),他本人亲自担任院长。在去年底的一次演讲中,李彦宏透露了他决定成立这个研究院的初衷:
“从一个人的自然状态来讲,其实键盘是非常难用的一个输入设备,更加自然的输入设备是什么?是手势,用手划来划去,是语音,我想说什么,甚至是图片,我拍一张照片,这些东西是更加自然的输入方式……但是像语音、图片,这些东西计算机其实是不认识的,那么怎么样让他们能够更好地被计算机所识别?最近这几年深度学习的这样的一个技术在这方面起了非常关键的作用。”
他的这段话中提到的应用——语音识别和图像识别——正是深度学习目前最主要的应用。
“找猫”的实验是深度学习在图像识别领域的典型应用。而在语音识别方面,苹果Siri用到了这一算法,微软则做过一次著名的演示:2012年,微软首席研究官Rick Rashid在一个活动现场演示了由机器将英语实时翻译为汉语,而机器能快速、准确地识别语音正是得益于深度学习。
不过百度的深度学习研究院成立一年多以来,尽管吸引了前Facebook资深科学家徐伟、前AMD异构系统首席软件架构师吴韧等人才加盟,副院长余凯也多次利用演讲、沙龙等机会向开发者介绍相关技术与应用,但其成果却十分有限。在语音方面,百度语音助手号称利用深度学习将“语音解码速度提升一倍,综合识别准确率提升8%”,但这并没有助其在市场上取得优势。在图像方面,据称用到了深度学习的百度魔图pk明星脸曾一度火爆,但很快热潮过去,此后也没有更多相关产品问世。
吴恩达此时加盟,一方面大幅提升了百度在深度学习方面的研发实力,另一方面也提升了百度的研究院在美国的号召力,有助于吸引更多优秀的硅谷技术专家加入百度。
如果百度能够在深度学习方面取得新的进展,不仅能提升自己部分移动应用的竞争力,也有望在当下异常火爆的智能硬件市场有所突破。事实上,语音识别与图像识别都是与智能硬件结合十分紧密的技术。在“小度”系列方面,前不久发布的“小度i耳目”摄像头便能结合人脸识别产生一些新的应用场景;而在Dulief平台方面,百度云若能集成更高效、精准的语音、图像识别提供给硬件开发者,相信也会吸引更多的硬件开发者使用。
当然,就像当初成立深度学习研究院一样,吴恩达加盟与百度研究院的成立都只是一个开始;他们究竟能否取得令李彦宏满意、符合外界期待的成果,还需要时间来验证。