亚马逊实体店,用深度学习和计算机视觉颠覆超市购物体验

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

亚马逊实体店,用深度学习和计算机视觉颠覆超市购物体验

文 | Evelyn Shen

Amazon宣布它在西雅图建立了第一家线下实体店。与传统商店不同的是,这家实体店不会有任何排队或者收银台,即取即走。

亚马逊实体店,用深度学习和计算机视觉颠覆超市购物体验

Amazon将这家167平方米的线下实体店取名为Amazon Go。当你从Amazon Go取走物品后,店内的感应器会自动感应到这个行为,并且直接在你的Amazon账户上扣去物品的费用。

亚马逊实体店,用深度学习和计算机视觉颠覆超市购物体验

Amazon还没有发布关于Amazon Go的技术细节,仅表示该技术使用了计算机视觉,传感器融合和人工智能的一个分支——深度学习,模仿大脑,监测购买行为并在离开商店时收费。

所以,我们目前只能对这些技术如何发挥作用,作出猜测。

亚马逊实体店,用深度学习和计算机视觉颠覆超市购物体验

首先,Bob扫描了他的手机。Amazon Go识别了Bob,并记录了他拿起的商品。

这里有一个重要的环节。Amazon Go用商店离的相机识别Bob。Amazon Go可能会用多个摄像头拍摄Bob的几张照片,并使用一些标准的深度网络(如Resnet,GoogLeNet或VGG)创建人像特征图。Amazon Go就知道了Bob的样子。

或者,Amazon Go也可以在商店中全程跟踪Bob。有较简单的方法来实现。但是,跟踪多个Bob和Alice,成本就会变得非常昂贵。因此,我们可以忽略这种方法。

亚马逊实体店,用深度学习和计算机视觉颠覆超市购物体验

Bob拿起商品。 Amazon Go只需要跟踪这个细节。在计算机视觉中,动作识别已经被设置。因此拿商品的动作可以容易地被识别,并且触发商品记录。一个的产品记录的算法会与之前计算的Bob的人像特征图匹配,并且将识别Bob正在拿商品。摄像机可以进一步定位Bob所拿的商品。

亚马逊实体店,用深度学习和计算机视觉颠覆超市购物体验

产品记录在这里是一个重要的部分。它主要涉及在产品被挑选或放回到货架时,对产品进行计数。由于杂乱和遮挡,在货架上计数产品对于相机会有些困难。但是,一台放置在货架后面的摄像头,可以像上方的摄像头一样拍摄,可以算出被挑选和替换的产品数量。它还可以识别Alice拿起的商品。然后它可以匹配爱丽丝,并在她的帐户上记录商品。

亚马逊实体店,用深度学习和计算机视觉颠覆超市购物体验

购物结束,走出去。只需再次将人物与其先前计算的人物特征图匹配。并且使用先前设置的付款系统(例如Bob的Amazon账户上的Google Wallet或信用卡)向Bob收款。

除了相机及计算机视觉以外,这里可能有其他系统。货架可能有用于产品记录的红外传感器。跟踪系统可能使用手机的GPS和商店的摄像头,在商品被拿起的位置将Bob匹配。

到这里整个过程看似流畅,但不妨来开几个脑洞。

如果我在商店的中间脱了外套怎么办?Amazon Go会混淆吗?如果我在货架前做了一个鬼脸?或者戴上了面具?

如果我没有把商品放回原来的货架?我会被收费吗?

我随身带着一个空的果汁瓶子。我从架子上取一瓶新的果汁,然后用空瓶更换。 Amazon Go将如何反应?

它也会识别盗窃行为吗?

Amazon Go到底智能到什么程度,我们还无从可知。

我们都或多或少的期待真正智能的时代,又或多或少的恐惧着那样的时代的到来。

那么人工智能到底能带给我们怎样的未来?

人工智能里面的核心部件之一是深度学习,为什么深度学习能够给人工智能带来革命性的转变呢?

真正人工智能领域的爆发在2012年,在深度学习的超乎预料的性能下,ImageNet(超大规模图片识别数据库)的比赛中获得冠军的第一名超出第二名将近10%之多。至此,一大波深度学习的人工智能的研究如燎原之势席卷着每一个领域每一个角落。似乎人工智能加深度学习就是无所不能。

人工智能加深度学习的绝妙之处之一就是它能够使得人工智能不再是专家独享:你可以是在图像识别领域工作多年的工程师,经过一年研究可以赢得自然语言处理比赛的冠军; 你也可以是专研语音识别多年的资深专家,可以陡然转业到自动驾驶汽车研发方向。很多传统行业和系统将要被替代, 很多职业标准将要被重新定义,很多就业机会将会消失,又有更多就业机会将要爆发。

不仅是因为行业界的壁垒就这样被深度学习打破,使得个人职业跨界变得更加可能;并且人工智能在很多方面等同或者超越人类的卓越表现,使得整个社会需要再次去定义那些事情可交由人工智能完成。不论是个人,还是公司,甚至是国家。“科技改变生活”又一次将要上演大戏。

深度学习和人工智能已然渗透了每一个人的生活的角落。各大从事自动驾驶的公司已经把全面实现自动驾驶的目标缩短到五年计划, 如谷歌,Facebook, 百度,Tesla。 来自IBM Waston最新的cognitive computing system的人工智能可以担任高校大学生的助教长达半年,竟无一人发现。

DeepDream似乎赋予了人工智能做梦的能力,畅游在艺术的领域,传达似乎只有人类独有的混乱又秩序井然的思想。预测未来的能力被人工智能提高的前所未有的位置,其重要性和性能横跨了金融,农业,生物科技,灾难预测,天体物理,以及其他你能想到或不能想到的应用。并且世界里将有越来越多的秘密被这种神秘的计算框架所解析。

原文>>>

End.

随意打赏

提交建议
微信扫一扫,分享给好友吧。