案例解析:AI产品设计,怎么在不同情况下做出判断?

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

独立思考,实事求是,锲而不舍,以勤补拙。

——一颗西蓝花

案例解析:AI产品设计,怎么在不同情况下做出判断?

一、从AI技术说起

什么是机器学习?

Tom Michell 给出定义:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序从经验E学习。

通常,为了很好地定义一个学习问题,我们必须明确这样三个特征:任务的种类;衡量任务提高的标准,经验的来源。

举一个手写识别学习问题:

  • 任务T:识别和分类图像中的手写文字
  • 性能标准P:分类的正确率
  • 训练经验E:已知分类的手写文字数据库

机器学习与深度学习

深度学习是一种特定类型的机器学习,具有强大的能力和灵活性,它将大千世界表示为嵌套的层次概念体系。

深度学习是受人工神经网络的大脑结构和功能启发而创造的算法,由于它的兴起,使人工智能行业的应用取得了显著的成就,比如人脸识别

二、从技术到用户体验

伴随着技术的发展,市面上创造出来了大量的基于AI技术的产品。

产品设计,本身是一件非常难的事。

AI产品,因其应用场景的复杂性,让产品设计这件事变得异常困难。对产品经理,在设计产品时候,对实际应用场景的思考,要求更加高。

AI产品的设计,对产品经理在设计产品时候,对应用场景的思考,更加透彻。

《用户体验要素》的文章开篇,有如下一段话:

在产品设计时候,我们对用户体验的关注实在是太少:我们所生产的产品是供人们在现实世界中使用的。在产品开发过程中,人们更多地关注产品将用来做什么。用户体验是经常被忽略的另一个因素——即产品如何工作——而这一因素恰恰是决定产品成败的关键因素。

用户体验并不是指一件产品本身是如何工作的,用户体验是指“产品如何与外界发生联系并发挥作用”,也就是人们如何“接触”和“使用”它。当人们询问你某个产品或服务时候,他们问的是使用的体验。用起来难不难?是不是很容易学会?使用起来感觉如何?

上述摘录中,有一段话,很有意思,单独拿出来:

在产品开发过程中,人们更多地关注产品将用来做什么。用户体验是经常被忽略的另一个因素——即产品如何工作——而这一因素恰恰是决定产品成败的关键因素。

我解释一下,上面这句话的意思。一共有两层理解:

  • 第一层,在产品开发的过程中,产品经理更多关注这个产品将来做什么。即理想情况下,该产品将来的功能。
  • 第二层,指出产品经理忽略的一个点,当产品被应用到实际场景中的时候,这款产品与真实的场景交互,在这样的一些场景中,产品又将如何工作。

在产品开发中,产品经理容易忽略产品与真实场景的交互。AI产品的设计更是如此,AI产品的使用场景复杂,很多时候需要产品在不同情况下做出判断。如果产品经理没有提前将所有可能出现的场景思考到且提前做出设计方案,那么该产品造成的用户体验可能会非常糟糕。

用一个AI产品的例子来说明。

二、AI场景,行人闯红灯抓拍

还原「行人闯红灯抓拍」的真实业务场景:

十字路口,为了更好规范行人与车辆,因此有了红绿灯。当红灯亮起时,行人也好,车辆也好,都不能通过或行驶。当绿灯亮起的时候,行人和车辆均可通行。

但总会有人,不遵守交通规则,闯红灯。因此,在这种场景下,我们可以借助AI来帮助我们更好地监控行人闯红灯的行为。我们希望,如果有行人A闯了红灯,那我们的设备可以将此人记录下来,并向后端监控设备上传该用户闯红灯的事件信息,包括时间、地点、行人的脸。

上面的需求描述,比较宽泛,让我们思考如何将该需求,拆解成算法(AI)+硬件可实现。

  1. 红灯期间,集成了算法工业相机检测并抓拍到红灯期间出现在斑马线上的人;
  2. 将该事件相关信息,包括时间、地点、行人的脸一共上传到后端监控设备。

三、从需求文档到实际业务场景

需求文档输出后,我们这款产品似乎马上就要成功了。但是,我们来看一个图:

案例解析:AI产品设计,怎么在不同情况下做出判断?

(1)上面这个图是什么

作为宣传广告,印刷在公交车身的董明珠女士,被抓拍到闯红灯。并且,登上了当地的行人闯红灯曝光台。

(2)为什么会出现上述情况

产品经理在输出需求文档时候,只描述了需求是检测行人闯红灯。没有考虑车身广告这种情况,因此没有事先思考解决方案,故而出现了上图的情况。

俞军老师在他的新书《俞军产品方法论》中,讲到:

技术本身并不创造价值,技术必须被应用于产品。

无论是多么高端的技术,脱离了产品,都

四、怎么做得更好?

4.1 还原真实场景

让我们来思考一下真实的业务场景,红绿灯是在十字路口,用来维持交通秩序的。

案例解析:AI产品设计,怎么在不同情况下做出判断?

当A通道的红灯亮起时候,A通道的行人以及电动车、自行车都都不得通行。此时B通道的车辆是可以通行的。如果说,B通道的车辆车身印刷有人像,那么会出现什么情况呢?

或许在一开始设计产品的思路,没有想得足够深入,忽略了这种场景,从而导致了上图印刷在车身的董明珠被识别为闯红灯的行人。

4.1 怎么做得更好

我们了解了真实场景,基于对真实场景的理解,如果重来一次,我们如何做得更好呢?

  1. 活体检测: 场景需求是对“行人在斑马线闯红灯”的抓拍,因此算法需要检测的区域是“斑马线”区域。需要检测的目标是“行人”,时间段是在红灯时间段。检测区域是“斑马线”,检测目标是“闯红灯行人”。在这个区域,在红灯时间段,出现车身人脸,因此被系统检测为了闯红灯。针对这种场景,我们可以提前想到“活体检测”的解决方案。
  2. 边界分析: 我们需要将检测边界按照时间、地点、人物三要素进行设定,对应到本场景中,即:红灯时间段、斑马线区域、人脸+活体。
  3. 技术方案: 在这种场景下,如何做活体检测呢?由于场景的开放性,不能像在线支付那样,我们可以要求用户左看看,右看看。那我们可以加一个目标检测,如果检测到人脸、且检测到汽车,则我们可以排除。同时,行人闯红灯过马路,是一个连续的动作,这个过程会持续一段时间,我们可以将这个作为切入点。一是可以考虑增加“姿态估计”,二是考虑“轨迹”检测到第一张脸后不做推送,而是继续检测,同时考虑公交车的移动方向与斑马线行人的移动方向是垂直方向。

总结

  1. 从算法模型到部署到真实业务场景中,AI产品经理/项目经理需要思考很多很多。
  2. 很多时候,需要思考产品如何与真实业务场景产生交互,这非常重要,而不单单只思考我们期望中的算法该如何运作。
  3. 产品如何与世界交互,这非常重要。

参考:

  1. 《用户体验要素》
  2. https://github.com/lonelygo/Shift-AI-models-to-real-world-products

 

本文由 @一颗西兰花 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

随意打赏

提交建议
微信扫一扫,分享给好友吧。