阿里“图像搜索之父”获国际大奖 手淘神器将成新爆发点

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
在华先胜看来,手机淘宝上的“拍立淘”,不仅是搜寻商品的入口,未来还可能成为人们获取信息(包括购物、教育、娱乐、新闻、知识等)的一种习惯——而这背后,在电商“刚需”的引导下,图像搜索正面临厚积薄发的时刻。

近日,美国计算机协会(ACM)公布了2015年度杰出科学家名单,在上榜的两位亚裔学者中,阿里巴巴图像搜索的领军人物、阿里巴巴搜索事业部研究员华先胜位列其中。

与此同时,国际电气与电子工程师协会(IEEE)也公布了华先胜当选2016年度IEEE Fellow(IEEE会士)的消息,以嘉奖其“为多媒体内容分析和图像搜索做出的突出贡献”。


华先胜获ACM2015年度杰出科学家

两大奖项的背后,不仅意味着阿里图像搜索技术已经获得国际最顶尖学术圈的认同,也让“拍立淘”这一阿里搜索“大杀器”再次获得关注。

数据显示,华先胜与同事们推出的“拍立淘”等王牌产品,正在被越来越多的手淘用户使用和喜爱:2015年双11当天,千万消费者使用“拍立淘”购买了数千万元的商品。

点击手淘搜索框里的“相机”图标,对准喜欢的商品,或者把商品拍成相片,手淘就会自动帮你找同款——移动时代的这种炫酷的“以图搜图”,与以往的搜图索行为大相径庭。

而在未来,实现“所见即所得”,图片搜索更将成为人们获取信息的常态。对此,也有分析人士表示,借助图像搜索技术的领先,阿里搜索极有可能在视觉时代实现“弯道超车”。

“双11”千万用户拍立淘扫货  图像搜索时代 阿里凸显“独门“优势

得到国际同行的高度关注和认同,华先胜告诉表示记者,其原因在于背靠淘宝数十亿级的商品图片库,“与通用搜索不同的是,电商场景中,以图搜商品是用户的‘刚性需求’。

无论是在杂志电视上,还是身边街头,看到一件心仪的商品,可能难以用文字描述,却可以拍成照片,上传到手淘的“拍立淘”找同款。在“拍立淘”背后默默发挥作用的,就是图片搜索这一可视化搜索方式。

阿里巴巴集团公布的资料显示,2015年双11当天,千万消费者使用了“拍立淘”功能,引导了超过数千万元的销售额。而拍立淘上线一年以来,拍立淘所覆盖的类目范畴,已经从最开始的女装,发展到目前的男女装、鞋包、配饰、食品、数码、家居、日用百货、内衣、瓶饮等十余个类目。


双11当天,有千万级的用户使用了拍立淘这一功能

与通用搜索主要依靠字节不同,图像搜索被主要定义为 “以图搜图”。据华先胜介绍,图像搜索的第一步是训练计算机进行图像理解,也就是通过计算机将图片中的要素,包括人像、颜色、纹理等具体特征以及深度学习产生的图像描述,转化为类似文字的“视觉词”,编成索引之后,才能再进行第二步——图像搜索。

从20世纪90年代开始,国际上就开始了对图像搜索的研究,但直到2008年前后,计算机开始能够处理大量图像,图像搜索技术才得以突飞猛进的发展。

2008年,还在微软亚洲研究院工作的华先胜,就因在图像和视频搜索方面的尝试,获得了由《麻省理工学院技术评论》颁发的“全球35位35岁以下的杰出青年创新人物(MIT TR35)奖”。

评委会在颁奖词中写道:“有效的基于内容的视频搜索仍然还有很多困难没有解决。而华先胜希望通过自动识别图像和视频中物体、场景、事件和其他语义特征来攻克这个壁垒。”

但当时能解决的,也仅仅是同图和近似图片的搜索,图像搜索仍有很多未知领域有待探索。在华先胜看来,能推动图像搜索下一步突破的关键有三点:深度学习,大数据分析和大量用户使用反馈。谷歌等公司虽然擅长通用搜索,但图像搜索方面缺乏“刚性”的应用场景,无法积累大量真实的数据和用户。

环顾国内外,似乎只有阿里巴巴能够同时具备这三个条件。

“电商平台是图像技术最具用户‘刚需’的应用场景,特别是以图搜图技术,目前只有电商场景才可以实实在在地产生可观的实际价值,而从另一个角度看,电商平台上大量的用户也是正是推动图像技术发展和应用的基础。”华先胜表示,阿里得天独厚的平台优势是吸引他从美国回来,加入阿里搜索团队的重要原因。

从“智能”到“更智能” 视觉时代阿里图像搜索弯道超车

作为行业的翘楚人物,华先胜另一项为业界瞩目的成绩,就是设计并实现了不需要“人工标注训练数据”就能产生识别任意目标的图像识别系统。

“之前,图像识别需要人工去给图像贴标签(Label),让计算机从这些数据中学习出识别模型,但我们提升了一步,训练计算机自己去找数据,建立自动识别的模型。比如要识别和搜索不同种类的花卉,不用标注900多种花卉的图片,而是直接输入花卉的名称列表,计算机就可以自行去网上找数据、进行清洗、补充、学习,然后就能进行图像识别了。”

华先胜介绍,这一技术可以适用于多种场景的图像搜索,比如明星脸识别,不用输入“范冰冰”的照片,计算机可以从网上自动学习辨认。

10月27号,在澳大利亚举行的国际顶尖多媒体学术会议ACM Multimedia 2015上,华先胜代表阿里的图像搜索团队,向在场几百名与会专家分享了“拍立淘”和虚拟化妆等电商应用,引起在场同行惊叹。对此,华先胜感叹说,“普通用户会觉得好玩,但圈内人会知道我们目前做的一切,包括‘拍立淘’准确度的提升多么难得,有多大的含金量。”

随着近年来深度学习技术在图像分析和识别领域的广泛应用,图像的描述(特征)有了非常大的进步,而阿里的大量商品图像数据和用户数据,包括用户使用反馈数据的挖掘和回流,也使得电商平台搜索结果的相关性不断提升,“拍立淘”的用户UV在过去半年内猛增了两倍多。

比如,同样一件外套,无论是挂在屋内的衣架上,还是在郊外穿在模特身上,“拍立淘”都可以把它相当准确地识别出来。而从智能到更智能,阿里的团队还在继续向图像搜索的“地心”推进,包括任意图像的语义相同或相似图的检索,也是华先胜搜索团队希望下一步攻克的课题:因为用户在用“拍立淘”时拍什么都有可能,可能不是商品,可能是任何物品和场景,如何准确识别、并返回对用户有价值的信息?


通过搜索下拉框,用户搜索主体(大衣)以外的商品

2015年底,美国计算机协会(ACM)公布了2015年度杰出科学家名单,华先胜作为仅有的两位亚裔学者之一位列其中。ACM创立于1947年,是国际上历史最悠久、规模最大、最权威的计算机专业学会,有“计算机界诺贝尔奖”之称的图灵奖即由该组织评选颁布。而获得“ACM杰出科学家”称号的,必须是在计算机业界中拥有15年以上的从业经历并作出巨大成就和影响的研究人员。

与此同时,国际电气与电子工程师协会(IEEE)也公布了华先胜当选为2016年度IEEE Fellow(IEEE会士)的消息。IEEE是全球最具影响力的国际学术组织之一,目前在全球160多个国家拥有超过40万会员。IEEE Fellow是该组织授予的最高荣誉,在学术科技界被认定为权威的荣誉和重要的职业成就,当选人数每年不超过IEEE会员总人数的0.1%。

在被国际学界关注的同时,有分析人士表示,借助图像搜索技术的领先,阿里搜索也极有可能在视觉时代实现“弯道超车”。

90后占“拍立淘“用户一半以上 准备好让“拍立淘”成为你的搜索框了吗?

根据手淘数据显示,在“拍立淘”用户中,90后占比高达55.1%,远高于无线搜索的该年龄段整体用户占比——年轻人显然更中意“以图搜图”这种看上去很“潮”的搜索方式。

实际上,拍立淘未来还有很多种玩法:比如,拍件衣服,拍立淘可以推荐与之搭配的服饰;输入家具的照片,拍立淘可以配套其它家具及家饰;包括AR(虚拟现实)方式,拍立淘可以实时展现摄像头前物品对应的商品及信息……

除了拍立淘,华先胜还举了这样一个运用到图像搜索技术的例子:淘宝店铺中的很多“大码”服装,由很骨感的模特试穿,这样很可能会影响到用户的试穿体验,但阿里搜索的图像识别系统,目前就能把”微胖“的模特作展示的店铺排在前面,让商品信息对消费者更有参考价值。

“图像搜索就像电商中的水电煤,有的产品,像‘拍立淘’是可以被用户感知的,有些技术演进则是藏在应用和服务背后,默默为大家服务。”

华先胜介绍说,其实电商平台上处处都有图像技术的需求,从商品图片的分析理解、商品识别、商品属性识别、场景识别,到人脸检测(试妆)、人脸属性(年龄、性别、颜值等)、人脸识别(如明星识别)、人脸合成(试衣)等,甚至视频分割、事件检测、物品检测跟踪、广告投放等,都离不开图片技术。可以说,图像技术正被应用于商品推荐、个性化、商品管理以及其他搜索的方方面面。

对于“拍立淘”的未来,华先胜表示,拍立淘将会拓展到更多领域,力争成为人们获取信息(包括购物、教育、娱乐、新闻、知识等等)的一个快捷、有趣、有效的入口,而不仅仅是搜寻商品的入口。“希望在未来,通过拍照或者相机镜头扫描动作会成为人们获取信息的一种习惯。”

所以,准备好让“拍立淘”成为你的搜索框了吗?

随意打赏

提交建议
微信扫一扫,分享给好友吧。