美国工程院院士 Peter Glynn:基于数据的决策——仿真与库存管理(附PDF下载)
在近日杉数科技于上海主办的「2018 第二届 AI 大师圆桌会」——「从链到网:数字赋能零供新关系」上,杉数科技围绕智慧供应链的背景及现状邀请到了多位学者及企业嘉宾到场交流。
斯坦福大学教授、美国工程院院士 Peter Glynn 结合他在仿真技术框架在模拟与决策中的相应研究,向与会观众分享了他在大规模数据下,如何基于随机模拟解决不确定性因素众多的商业决策。
在AI科技评论后台回复“杉数科技”,获取完整版演讲原文
美国工程院院士、斯坦福大学教授 Peter W. Glynn
今天我主要是基于相关的研究问题,给大家分享一个观点——基于数据的决策。为解决各类问题,给大家展示一个由机器学习、人工智能和其他工具共同搭建的平台。
我们讨论利用仿真来进行决策,尤其是在库存管理的背景下。机器学习和人工智能正对世界产生着巨大影响,近几年的影响可能比过去几十年的总和还要突出,但这并不意味它们能解决所有的决策问题。而仿真也正在解决令人兴奋的决策问题,在决策中同样举足轻重。
当今的商业环境给予我们许多机遇和挑战。一是,更多的数据被收集,如各类数据在店铺层面、顾客层面和供应链层面被收集;二是,数据更加复杂,更多公司参与了零售环节,线上销售占据了更大比例,让人深思未来产业链的分配模式和新兴科技例如自动驾驶带来的影响。三是,很多决策过程甚至不需要人类的参与而是自动进行的。四是,对实时决策的需求突出。
最核心的问题是如何利用数据做更好的决策。当然我们都知道,机器学习和人工智能被广泛且有效地在这一领域得以应用。
机器学习和人工智能并不是仅有的途径,对于特定情境下的问题,机器学习并不适用,尤其是回答一些“what if”的问题时。 当过去已发生过类似的例子并收集到大量的数据时,机器学习可以被应用,但很多时候我们没有足够的数据,或者无法获取这些历史数据,这时候机器学习就没有那么有效。
比如,第一个例子,一个零售商想要新建一个自动化的配送中心,来取代现在的人力配送。这是一项花费巨大的工程,所以管理层会想要关心这个中心能帮助提高多少配送时间和顾客满意度。这不是一个机器学习或者人工智能可以大放异彩的问题,因为我们正在面临一个崭新的决策,并没有相关的历史数据能告诉我们这个新技术给公司层面带来的利益如何。
第二个例子,近年来线上销售大红大紫,在零售商利润中占据了的很大比例,传统零售业更多地参与到线上销售的过程中,他们需要更多地了解线上销售来定位自己在线上销售中的位置。有一个自然的问题是,线上订单会给线下商店带来什么影响。显然会有更多的到店订单,但与此同时货架上的商品也会减少。这其中也有许多“what if”问题会显著影响到公司的成功与否。
第三个例子是供应链管理中的大危机,例如日本地震时主要的供应链被中断了几个月,很多工厂、零售商必须连夜之间重新配置供应链。这些危机也许在未来会更普遍,因为我们的供应链趋向于全球化,因而也更有可能被潜在的危机影响。但是,对于这些问题严重缺乏历史数据,所以机器学习和人工智能难以适用。
但这些都是仿真可以代替机器学习起到作用的情景。
仿真通过利用计算机和计算机实验来进行决策,主要的想法是建立供应链或者库存管理模型,迅速进行大量计算机实验来寻找主要会发生的典型情景,寻找出系统发生大变化时产生的主要影响。仿真的作用就是在问题真实发生和决策被实施之前了解到它们并及早采取措施。
在现实世界中,大多重要的管理启发并不是量化的,但在机器学习中我们得到的经验和启示都是量化的。对于一个大规模的系统,机器学习的量化信息可能无法帮助我们理解系统的本身的工作原理,但是仿真也许能让我们追溯到模型的源头,了解一个供应链优于另一个的原因。
想要把一个系统的机理完全用量化的方式来衡量并不是一件容易的事。另外,在制定重大决策或者进行大笔金额投资时,我们倾向于看到各种可能结果的分布,而不是仅仅一个可能的结果。因为这一结果与随机发生的事件有关,是一个有特定原因的结果,而我们如何理解这一结果对于如何决策至关重要。
仿真不仅仅能够补充机器学习完成其不能,同时适用于优化领域。因为优化方法在处理现实问题时,倾向于抽象并简化很多现实世界中的特点与条件,而运行仿真系统,可以包括更多的细节来验证优化问题的结论或观点对于真实世界是否适用。
所有的仿真模型需要数据,我们通过服从指定的分布生成随机变量的方式形成数据。例如在分配中心问题中,我们需要运送时间的数据,线下商店需要实现当地客户需求所花费的时间。其核心问题是如何建立概率模型来进而建立仿真模型。我们想要知道对于一个特定的投资组合的决策有多大的风险,利用计算机来进行仿真是预测风险的一个经典方法。例如模拟并计算未来30天内有巨大财产损失的概率,仿真对于极端事件非常敏感,所以我们想要关注的其实是极端的价格变化,常用的数据统计方法把所有数据视为同等重要来考虑,然而我们考虑的并不是分布的中间,而是分布的两边(尾部)。同样在库存管理中,我们并不是非常担心典型的供应链行为,而更关注5%的极高顾客需求或系统负荷反常行为带来的影响。这和我们传统的数据处理和仿真模拟的想法完全不同,蕴含了很多具体有趣的研究问题,正在被我们关注。
另一个研究问题是数据仿真,这个概念在天气预测中最容易得到解释。我们得到各种各样的测量工具和数据,如何通过这些数据更好地预测天气就是一个核心问题,事实上人们做的事情正是一个初始化的仿真系统,求解一个基于前向时间的微分方程来理解大规模的天气系统,例如对未来二十四小时某地天气的预测。这类问题也越来越多的产生于零售业中,同样有大量不同来源种类的数据,具有不同的可靠程度和稳定性等,如何整合这些数据并做出更好的决策是一个即将变得愈发重要的数据仿真问题。
总的来说,机器学习和人工智能将会是变革世界的重要科技,但仿真可以作为评估和补充它们的有效工具。
雷锋网版权文章,未经授权禁止转载。详情见。