转型AI产品经理需要掌握的硬知识(一):AI产品经理能力模型和常见AI概念梳理
近几年,从亚马逊, Facebook,到谷歌,微软,再到国内的BAT,全球最具影响力的技术公司都将目光转向了人工智能( AI )。2016年 AlphaGo 战胜李世石,把公众的目光也聚集到了人工智能。创新氛围最活跃的中国,已将人工智能定位国家战略,2017年11月15日,中国新一代人工智能发展规划暨重大科技项目启动会在京召开,公布我国第一批国家人工智能开放创新平台,包括:百度-自动驾驶工智能开放创新平台;阿里云-城市大脑人工智能开放创新平台;腾讯-医疗影像-人工智能开放创新平台;科大讯飞-智能语音人工智能开放创新平台。现在中国的所有互联网公司,不论大小都在布局人工智能,似乎产品中没有人工智能的元素都不好意思找投资人,大量的科技巨头和专家预测人工智能将带来第四次革命,继农业革命,工业革命,信息革命后从底层改变我们的工作和生活,也有很多专家认为人工智能是中国超越美国的一次千载难逢的机会。
作为一个充满好奇心的产品经理,经过一段时间的学习思考,将我个人对于AI产品经理需要掌握的基础知识进行总结,因为AI产品经理是一个全新的岗位,至今没有明确的能力模型定义,本文只是将我个人的学习和思考进行汇总,将产品经理需要了解的AI知识进行框架梳理,将学习过程中看到的一些资料进行归纳总结,希望对想要转型AI产品的朋友有所帮助。
因为内容较多,将分成三个部分展开论述:第一部分,介绍AI产品经理能力模型,人工智能发展史及看待人工智能的几个视角,总结学习资料和方法;第二部分,介绍人工智能的常见算法,如何零基础通过 TensorFlow 实现手写数字识别。第三部分,分析AI产品经理在2B和2C领域的能力差异,介绍一些可体验的AI产品。
一、AI产品经理能力模型
1、AI产品经理能力模型概述
从现在的招聘市场来看,产品经理岗位已经出现大量细分,如数据产品经理,支付产品经理,ERP产品经理,CRM产品经,供应量产品经理,POP产品经理等,AI产品经理可能将成未来的一个主流细分岗位,而且因为AI对应的领域不同,AI产品经理下面将衍生出大量的细分行业AI产品经理。在讨论AI产品经理之前,我们来看看,非AI产品在公司中需要面对哪些角色,而面对这些角色需要的能力模型是什么,在这个基础上我们再来讨论AI产品经理的能力模型。
产品经理需要每天与工程师,设计,老板,运营,市场,用户/客户,测试等部门同事沟通,AI产品经理从对接人上来看,增加了AI科学家或者AI工程师,为了可以顺畅沟通,产品经理的知识结构必然需要增加相应的知识,以提升沟通效率,清楚产品设计边界,同时,因为AI产品与客户的业务结合更加的密切,所以需要对所设计产品的行业有纵深的全流程理解能力。在这个基础上,我们来尝试搭建AI产品经理能力模型。
产品能力模型可以从人,事,知识三个角度搭建,通过上文的分析,我们可以看到,在人和事上产品经理的能力几乎没有太大变化,但是在知识层面需要进行基础储备,以提高与AI科学家和AI工程师的沟通效率。人工智能技术正处于高速发展时期,充满了不确定性,所以产品经理的认知极限一定程度上影响了产品的未来,本文将总结人工智能领域的一些基本概念,认知极限需要靠阅读最前沿的paper和团队的AI科学家/工程师多交流,行业纵深的理解需要真实的参与到业务的整个过程中学习,这就为一些非互联网领域的,有着多年细分行业工作经验的,清楚全业务流程痛点的非互联网人提供了转型机会,后面会详细论述。
2、AI产品经理≠AI科学家,应用实现门槛不高
提到AI大家第一印象可能想到的是复杂的数学公式,天书一样的算法模型,需要学习AI难如登天。但实际情况是,即使做一名AI应用开发工程师,可能也未必要需要理解那些天书一样的复杂算法,Google的深度学习框架Tensorflow极大的降低了数学门槛,这个框架内置了损失函数优化方法,而Keras(基于Tensorflow构建的深度学习框架)可以把一个模型代码量大大减少,究竟能减少多少呢,我们以机器识别猫狗照片的分类器模型为例,可以通过下图中的14行代码搞定,寥寥几行代码就把一个拥有着卷积层、池化层和全连接层并且使用Adam这个较高级优化方法的深度学习网络架构写出来了。
网上有一张图,很有意思,生动的表明了不同的人对机器学习的理解:
我们的目标是成为一名合格的AI产品经理,而不是工程师,所以只要清楚这些技术的实现框架就可以了,只要可以清楚的描述客户需求场景,深刻理解客户诉求,并将其清晰的描述给AI科学家,并能听懂AI科学家的话就可以了,至于他们使用了什么模型,什么算法并不需要你去操心。
3、非互联网行业转型的新机会
前文中提到了AI产品和服务对于垂直行业知识的要求比较严格,下面为face++招聘安防类AI产品经理招聘要求。
1. 熟悉安防视频业务逻辑,熟悉雪亮工程项目建设内容,熟悉平安城市业务建设要求,熟悉智慧交通业务需求,具备实际产品设计与研发、交付全周期经验者优先。2. 2年以上安防行业产品设计经验,负责安防行业产品整体规划,配合公司行业发展,支撑产品行业解决方案;3. 负责安防行业的产品市场分析及竞争分析,制定相应产品策略;4. 负责安防系统平台的产品定义、平台产品导入和平台产品策略;
可以看出,传统行业中的从业者可以利用其多年经验为AI团队提供认知价值,所以非互联网行业的从业者完全可以通过补全上文提到的互联网产品经理相关知识转型进入到高速增长的AI领域。
二、人工智能发展史
智能:以宽泛的心理能力,能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作
人工智能:制造出智能的机器,尤其是智能的计算机程序,它能做一些以前需要人才能做的事情,这个机器或者计算机程序就叫人工智能。
人工智能有很多种的表现形式,目前在各个专业的方向,出现了很多超越人类的人工智能。比如在国际象棋上,有 IBM 的国际象棋大师“ Deep Blue ”;围棋上有 Google 的 AlphaGo和AlphaZero;医学上有 IBM 的“ Waston ”;私人助理上有苹果的“ Siri ”,微软的“ Cortana ”;甚至搜索引擎百度和 Google,你也可以把它看做是一个人工智能。它们都由一段段代码、一个个算法、一堆堆的数据组成。
人工智能的黄金时代(20世纪50~70年代)
1950年,一位名叫马文·明斯基(后被人称为“人工智能之父”)的大四学生与他的同学邓恩·埃德蒙一起,建造了世界上第一台神经网络计算机。这也被看做是人工智能的一个起点。同年,被称为“计算机之父”的阿兰·图灵提出了一个举世瞩目的想法——图灵测试。按照图灵的设想:如果一台机器能够与人类开展对话而不能被辨别出机器身份,那么这台机器就具有智能。而就在这一年,图灵还大胆预言了真正具备智能机器的可行性。
1956年,在由达特茅斯学院举办的一次会议上,计算机专家约翰·麦卡锡提出了“人工智能”一词。后来,这被人们看做是人工智能正式诞生的标志。在1956年的这次会议之后,人工智能迎来了属于它的第一次高潮。在这段长达十余年的时间里,计算机被广泛应用于数学和自然语言领域,用来解决代数、几何和英语问题。
人工智能的第一次低谷(20世纪70~80年代)
由于科研人员在人工智能的研究中对项目难度预估不足,导致与美国国防高级研究计划署的合作计划失败,社会舆论的压力也开始慢慢压向人工智能这边,导致很多研究经费被转移到了其他项目上。当时,人工智能面临的技术瓶颈主要是三个方面,
第一计算机性能不足,导致早期很多程序无法在人工智能领域得到应用;
第二,问题的复杂性,早期人工智能程序主要是解决特定的问题,因为特定的问题对象少,复杂性低,可一旦问题上升维度,程序立马就不堪重负了;
第三,数据量严重缺失,在当时不可能找到足够大的数据库来支撑程序进行深度学习,这很容易导致机器无法读取足够量的数据进行智能化。
人工智能的繁荣期(1980年~1987年)
1980年,卡内基梅隆大学为数字设备公司设计了一套名为XCON的“专家系统”。这是一种,采用人工智能程序的系统,可以简单的理解为“知识库+推理机”的组合,XCON是一套具有完整专业知识和经验的计算机智能系统。这套系统在1986年之前能为公司每年节省下来超过四千美元经费。在这个时期,仅专家系统产业的价值就高达5亿美元。
人工智能的冬天(1987年~1993年)
仅仅在维持了7年之后,这个曾经轰动一时的人工智能系统就宣告结束历史进程。80年代末,美国国防先进研究项目局高层认为人工智能并不是“下一个浪潮”,至此,人工智能再一次成为浩瀚太平洋中那一抹夕阳红。
人工智能的新春(1993~现在)
1994年Chinook Checkers,机器国际跳棋上超越了人类;
1997年Deep Blue深蓝战胜国际象棋世界冠军;
2006年,辛顿发表了一篇突破性的文章《A Fast Learning Algorithm for Deep Belief Nets》,这篇论文里辛顿介绍了一种成功训练多层神经网络的办法,他将这种神经网络称为深度信念网络。
2008年卡内基梅隆大学和通用的无人驾驶汽车CMU Boss研发成功;
2012年Amazon的仓储机器人Kiva,减少工人在仓库中走动的频次;
2013年,深度学习算法在语音和视觉识别上取得成功,识别率分别超过99%和95%,进入感知智能时代。
2014年计算机被当13岁男孩 首次通过图灵测试
2014年没有刹车、没有方向盘,只有一个启动Button的Google Car;
2016年AlphaGo4:1战胜李世石;
2017年神秘Master60盘连胜,狂扫棋坛高手。
三、看待人工智能的几个视角
人工智能领域包含大量的概念和定义,如监督学习,机器学习,强化学习,强人工智能等,最初学习的时候很容弄混,其实很多概念是不同角度观察的结果,还有些概念是嵌套关系,现将人工智能领域的概念从不同视角进行梳理。
1、 从连接主义学习来看
非监督学习(unsupervised learning), 非监督学习学的是没有标准答案的样本。拿猫和狗的图片识别举例。算法要自己去寻找这些图片的不同特征,然后把这些图片分为两类。它实际上不知道这两类是什么,但它知道这两类各有什么特征,当再出现符合这些特征的图片时它能识别出来,这是第一类图片,那是第二类图片。监督学习(supervised leaning),是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。 拿猫和狗的识别来举例子。算法看一张图就告诉它,这是猫;再看一张图片,告诉它这也是猫,再看一张图,告诉它这是狗,如此往复。当它看了几十万张猫和狗的图片后,你再给它一张陌生的猫或者狗的图片,就基本能“认”出来,这是哪一种。这样的学习方法很有可能造成模型把所有答案都记了下来,但碰到新的题目又不会了的情况,这种情况叫做“过拟合”。强化学习(reinforcement learning),所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。在智能控制机器人及分析预测等领域有许多应用。 我们小时候,看到马戏团的猴子居然会做算术题,感觉到很惊讶,这是怎么做到的呢?其实就是每次拿对了数字的时候,训练人员就给它一些食物作为奖励,这些奖励让他“知道”,这么做是“对的”,如果拿错了,可能就会有惩罚,这些惩罚就是要让它“知道”,这样做是“错的”。
2016年的 NIPS 会议上,吴恩达 给出了一个未来 AI方向的技术发展图,毋庸置疑,监督学习是目前成熟度最高的,可以说已经成功商用。
2、从智能水平来看
因为好莱坞大量AI题材的影视作品,我们看到的大量的超人工智能,所以再来看现在的AI产品就感觉没那么智能。从智能水平上划分,我们可以将人工智能分为三类,弱人工智能,强人工智能,超人工智能。
弱人工智能Artificial Narrow Intelligence (ANI): 弱人工智能是擅长于单个方面的人工智能。比如有能战胜象棋世界冠军的人工智能,但是它只会下象棋,你要问它怎样更好地在硬盘上储存数据,它就不知道怎么回答你了。强人工智能Artificial General Intelligence (AGI): 人类级别的人工智能。强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干。创造强人工智能比创造弱人工智能难得多,我们现在还做不到。超人工智能Artificial Superintelligence (ASI): 牛津哲学家,知名人工智能思想家Nick Bostrom把超级智能定义为“在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。”超人工智能可以是各方面都比人类强一点,也可以是各方面都比人类强万亿倍的。
3、从技术分层来看
认知:是指收集信息和解析信息来感知世界,比如图片识别、语音识别、自然语言处理等;预测:是指通过计算,来预测行为和结果。比如广告推荐,歌曲推荐等;决策:是指确定实现的方式和路径,比如移动路线规划、自动买卖股票等;集成解决方案:是指人工智能和其他技术结合时,产生的多种集成解决方案,比如和汽车结合就是无人驾驶,和医疗器械结合就是手术机器人。
目前商业化比较普遍的,是认知和预测领域的应用。
4、从技术分类来看
基础架构层:云计算、芯片、Tensorflow等框架;中间层:图像识别、语音识别、语义识别、机器翻译等;应用层:智能滤镜,讲故事机器人,助理机器人,搜索引擎,内容推荐,阿里鲁班制图等。
5、从应用场景来看
互联网和移动互联网应用:搜索引擎、精准营销、用户画像、反欺诈智能交通:自动驾驶、共享出行、自动物流智能金融:银行业、保险业、证券投资(风控、反欺诈、投资决策)智能医疗:辅助诊断、手术机器人、智能制药、辅助器官、外骨骼智能农业:智慧农业管理系统、智慧农业设备智能写作:写稿机器人、收集资料机器人机器翻译:文字翻译、声音翻译、图像翻译机器仿生:动物仿生、器官仿生智能助理:律师助理、时间管理助理创作艺术:编曲、写歌、写小说、绘画
p.s. 人工智能>机器学习>深度学习>神经网络模型>卷积神经网络=递归神经网络
四、学习资料和方法
1、推荐书
科普-发展类:《浪潮之巅》《人工智能狂潮:机器人会超越人类吗?》《人工智能:李开复谈AI如何重塑个人、商业与社会的未来图谱》《智能革命:迎接人工智能时代的社会、经济与文化变革》《AI:人工智能的本质与未来》《科学的极致-漫谈人工智能》《终极算法》
科普-脑洞类:《三体》《未来简史》《奇点临近》《机器人时代》
个人感觉产品经理读上面的这些有一个宏观的认知就可以了,核心是对业务纵深的理解,对AI技术边界的理解,对AI技术知识的框架理解(后面会介绍机器学习的常见算法及应用场景),下面的书是AI开发同学会看的书,真的感兴趣可以看看。
学术类:《世界著名计算机教材精选·人工智能:一种现代的方法(第3版)》《深度学习》
编程类:《白话深度学习与TensorFlow》《TensorFlow实战》《Python编程 从入门到实践》
数学类:《数学之美》《程序员的数学》(简单数学入门)《程序员的数学-2》(概率与统计)《程序员的数学-3》(线性代数)
2、推荐学习网站
吴恩达在163课堂上的深度学习课程、coursera上的机器学习课程、gitchat上人工智能课程、udacity上深度学习课程等
3、推荐公众号
36大数据、凡人机器学习、机器之心、CSDN大数据、智能玩咖、专知、网易智能
4、读paper网站
https://www.semanticscholar.org/search?q=ai&sort=relevance、google 论文
因为AI产品经理能力模型中很重要的一点就是拓宽认知边界,所以非常有必要读最前沿的paper,不用纠结与算法,只看这样的算法可以做什么!
P.S. BAT做AI能不能成?最大的机会在哪里?
在回答这个问题之前,我们先来看人工智能当下的发展现状,当下的人工智能是有明确边界的,有一种说法叫一秒法则,人工智能可以处理人1秒中可以想出答案的问题,这个问题还需要有以下几个特点:大规模,重复性,限定领域,快速反馈。从前文中人工智能发展史我们可以看到,资本在人工智能发展中扮演重要角色,而当下人工智能的特性非常适用于企业层面的效率提升,而且企业可以承担更高的采购费用,企业投资和个人消费的逻辑差异性极大,企业计算的是相对人工的长期成本差异,一个机器人10万元,可以持续升级并使用四年,这个成本就远低于一个工人的四年人力成本总和,而且机器人不用休息。所以我们能看到,今天的AI主要也是在2B端发力,2C端的产品多是音响,助理等,用户付费意愿不强,或者使用场景单一,曾经看过一份报告,语音机器人的最主要交互是查询天气预报,定闹钟,听音乐,这远远达不到家用机器人的要求。
再来看BAT在人工智能方面有哪些优势,BAT在人工智能的布局早早开始,百度A(AI)B(Big data)C(Cloud)战略,阿里的达摩院,腾讯也有腾讯云,大数据中心,人工智能实验室,这些大公司胜在基础架构层、数据量和资本优势上,拥有大量的人工智能科学家,可以持续优化算法,提升算法模型的准确度。
从产品对于AI技术准确性需求的角度来看,可粗略分成两种产品,一种是需要算法准确度需要达到99.9999%才能应用的产品,一种是算法准确率达到99%或者95%就可以的产品。
准确度要求极高的产品或服务。如手术机器人,自动驾驶技术,智慧交通等,这些产品和服务直接关系到人的生死,要求具有极高的准确度,需要AI科学家持续的优化,只有达到近乎百分之百的准确度才会商用。
准确度要求不高的产品或服务。如面部识别,语音机器人,无人机农药喷洒,艺术设计,搜索引擎,精准营销等,这些产品和服务对于精确度要求不高,因为即使不精确也不会直接造成人员伤亡。
再来从行业的垄断程度看,分为垄断程度高的行业和垄断程度低的行业。
垄断程度高的行业。行业的垄断程度越高,头部公司的体量越大,最初可能因为缺乏AI技术而采购技术,当技术环境成熟,BAT和google这类公司开源了大量源码后,行业垄断型公司会则会搭建自己的AI团队,搭建自己的大数据,云计算和AI实验室,以运营商为例,资源垄断型市场,三家独大,每家都在搭建自己的大数据分析平台,也在搭建自己的人工智能实验室。
垄断程度低的行业。如衣食住行相关的零售行业,因为分散,他们有需求,但是没有足够体量和资本自己搭建AI团队,所以他们会将AI技术作为一项工具,以合理的价格采购成套服务,来实现+AI的升级,如同现在的饭店都会使用美团,大众点评等服务,为自己晚上线上到线下的导流。
如同当年的互联网+和+互联网一样,也会演化出AI+和+AI的发展方向。
通过上面的分析,我们可以绘制象限图。我认为第一象限因为BAT拥有科学家优势,虽然垄断程度高的企业很有钱,但是因为BAT有数据优势和科学家优势,在这个领域BAT优势明显,可以向企业提供独特的AI服务,提升垄断企业效率,这部分产品需要靠AI科学家驱动。第三象限虽然技术门槛低,垄断程度低,会出现大量小AI公司进入这个市场,BAT进入这个市场拥有足够的品牌和数据优势,因为市场需求量较大,BAT可以考虑做开放平台,为有垂直领域的AI小公司提供开源开发平台,通过云服务获利,如果自己来做,这部分服务和产品将是运营和产品来主要驱动。第四象限垄断企业会自己组建AI团队来做,我们能看到,手机制造这个还不算垄断的行业中,因为资本实力雄厚,各个厂家已经在组建自己的AI研发团队,但是BAT有巨大的用户行为数据优势,可以考虑通过变相的用户画像进行对接,实现一定程度的数据加密互联。第二象限暂时来看不太适合进场。
回答最初的问题,个人感觉BAT做AI有机会,在第一象限有技术和数据优势。在第三象限有数据和品牌优势,如果做垂直领域,可以通过招聘获取垂直领域的认知,垂直领域的市场拓展是最困难的,下面将从企业属性来分析这个问题。第四项象限,BAT有数据优势,可以通过合作方式互通互联。
关于2B类的服务,这里提供给大家两个视角,第一个视角,从民营企业视角看AI。第二个视角,从国营企业视角看AI,笔者个人感觉,民营企业和国有企业的在+AI上的需求上差异性极大。
从民营企业视角看AI。民营企业的核心诉求就是创造更多的价值,赚更多的钱,可以从开源和节流两个角度进行+AI,民营企业家和管理者有充足的动力去进行改革升级,只要技术是有用的,可以提升效率或压缩成本的,民营企业会积极拥抱改变,从吴晓波老师的激荡三十年可以看到,中国的企业家不缺乏面对变革时转型的决心和行动力。BAT可以考虑在尽可能多民营企业家聚集的场合,推广真实高效的+AI产品和服务,如吴晓波频道的年会等。
从国营企业视角看AI。国营企业即承担创造价值的责任,也同时承担着保证国有资产不流失的责任,组织内部员工多是对上级和自己的职位负责,所以创新一定要稳妥,而且国营企业有个有趣的现象,每年年底写第二年工作计划时,必须要有创新,也就是每年都要有新的创新点,但是不能太激进,国有企业的核心诉求是不犯错,未必有功,但求无过,所以如果BAT的产品只是专注于提升效率并不符合国有企业的中层和领导的诉求。但是,国有企业其实有大型互联网公司赋能创新的需求,这个时候需要BAT等AI企业积极主动的提供解决方案。现在的国有企业技术服务招标有一套冗长的流程,所以要想搞定这些国有企业,首先提供高效便捷的AI产品和服务,从顶层或中层得到领导认可,从执行层面为企业招标准备完善资料和陪标公司。大型的国有企业的定制化要求很高,现在用友和亚信等软件开发团队多是长期驻厂,提供运维服务和新需求开发,如果BAT真的想要做垂直领域的AI服务,则需要BAT放下架子,做好持久战的准备。
下一篇文章将介绍AI常见的算法和常见AI产品使用的技术模型,并介绍一些常听到的模型概念,如卷积神经网络,递归神经网络等,同时将分享如何利用TensorfLow快速实现手写数字识别,准确度可达到98%,通过这个过程,产品经理们可以初步了解到AI的实现过程。