AI算法商城是伪命题?共达地AutoML的智慧工地保卫战
引:算法商城是伪命题吗?
同样都是成熟算法,为什么有的落地后精度低于10%,有的却能达到90%以上?
随着碎片化AI需求的涌现,市场上出现越来越多“算法商城”,给客户提供“点单-交货-支付”的轻型算法服务,让“买算法”就像“下载APP”一样简单。
但落地到现实中,开篇的问题就出来了。带着这些疑问,我们今天来聊一聊,与共达地AutoML、智慧工地、AI算法商城有关的案例。
“南水北调”路上的困境
案例发生在“南水北调”河北路段某工地上。
客户想对工人是否佩戴安全帽、是否穿着反光衣进行识别。
无需赘述,这个需求不论对于人工智能领域还是智慧工地领域,都是“老熟人”。市面上有大量“安全帽识别”、“反光衣识别”类成熟算法,在整个智慧工地建设中,也属于末端小需求。
但就是在这个末端小需求上,翻了车。
最初,客户采购了市面上某AI厂商算法商城中的成熟算法,顺利部署到应用场景后,精度竟然不足10%——用客户的话说,满屏误报,让人瞠目结舌。
双方开始排查问题,迭代算法。
事情并不复杂,该算法商城提供的成熟算法,在常规场景下,准确率确实能达到商用水平,但实际应用场景却并不常规。 一是摄像头距离被被识别物非常远,且变焦球机来回运动,被识别的安全帽和反光衣都变成了“极小目标”;二是识别场景是在夜间,算法“看到”的数据特征与训练算法时所使用的数据特征千差万别。
由此,应用场景识别准确率低于10%也就不奇怪了。
现场实景:识别对象距摄像头较远
后面的迭代之路漫长且艰辛。
对于这家AI厂商而言,客户要的并不是常规的安全帽识别、反光衣识别,需要安排专门的算法工程师团队就夜间场景特征重新迭代算法,这场合作也就不是“下载算法”型的轻量交易,而是堆人头、堆工时的重型算法定制。
客户的感受也很糟糕。早期的满口承诺被满屏误报狠狠打脸。重新迭代算法还要配合提供近万张图片,既没有专门的人力支持,也没有懂行的专家,新增的工期和成本更是让人一肚子怨气。合作陷入了僵局。
案例梳理到这里,AI落地过程中的几个大坑已经浮现了:
一、 业务壁垒。 懂算法的人不懂场景,懂场景的人不懂技术,导致明明可以在前期说明的应用风险没有被及时识别,为合作埋下隐患。
二、 场景适配。 通过预训练大量算法,打造算法商城,填补市场上的算法供应空白,扩大人工智能的应用边界,这是一个很好的思路。但事实上,不存在真正“成熟”的算法,或者说,成熟的算法必然是不断“成长”的算法。所以,适配碎片化场景时,是否支持高效、轻量的“适当定制”,成为算法商城的一道坎。
三、 算法产能。 当问题进入到“定制”环节时,就需要重新拷问传统堆人头、堆工时生产算法的模式,在效率、成本上是否能跟上客户需求了。目前市场给出的答案是否定的。
对于这一点,深度参与这个项目的AI”老炮“吴先生深有感触:“我们在一线市场上,看到越来越多政企客户的招标书中,主动把AI作为重点建设内容,这是以前所没有的场景。当新的客户、新的需求冒出来时,如果你一套算法研发周期动辄几个月,成本上百万,客户根本接受不了,更不用说扛过试用阶段,往二期、三期推。”
夜间场景
所以,分析完这些问题,一个清晰的结论浮现出来: 当前人工智能应用环节中的问题,归根结底还是算法供给端的结构性问题 ——AI算法生产工具低效、生产模式落后所导致的问题,今天在智慧工地上可能是精度骤降,明天可能是工期漫长,后天则可能是硬件适配问题——源头的症结在表层可以有千万种展现,我们要去解决根本问题。
更简单但更强大,可能吗?
共达地接触这个项目时,工期已经变得非常紧张,于是我们采取了“摸着场景过河”的策略。
在共达地的算法商城里,也有“成熟”的安全帽识别算法和反光衣识别算法。于是,初期我们也把这些算法部署到应用场景,也取得了极低的识别准确率,不到70%。
但主菜在后面。共达地的项目经理分析了常见误报,主要来源于两类场景:一是被识别物与摄像头较远,低于识别的基本像素要求;二是容易将“像”安全帽的物品误识别为安全帽,尤其是当场景复杂、光线变化时。
于是,共达地的项目经理一方面对系统误报进行重新标注,手动纠正算法的重点错误;另一方面登录前端盒子,采集现场真实视频流,进行针对性地数据补充和喂养。然后以一天一个版本的速度进行算法迭代, 终于在5天迭代3个版本后,实际应用场景的算法精度超过95%,达到客户的要求。
共达地算法的应用效果
这个过程讲起来特别简单,但越是简单的事物,背后越是有一套庞大的支持系统。大家可能已经留意到几个关键指标:
一是在数据补充和优化方面,似乎没有遇到太多障碍。
在传统的算法定制模式中,需要上千近万张图片,才能喂养出一个精度较高的算法。但对于大部分传统产业客户而言,既无法提供足量照片,也无法提供有力的人员支持。
所以,共达地在技术层面,支持基于较小样本的算法训练;在策略上,支持异地采集,第三方标注服务,通过小步快跑的方式,让算法基于场景迭代、生长。在这个案例中,每次迭代优化500-1000张图片,三次迭代下来也只处理了不超过3000张图片,加上与曼孚、数据堂等数据服务机构的合作,极大地提高了效率。
二是成熟算法的轻量定制过程十分流畅。
客户与原AI厂商的合作之所以难以推进,主要在于重新定制算法将耗费大量人力和时间。这是传统AI生产模式的客观现实。
共达地的差异点在于,无论是算法商城中的“成熟”算法,还是部署到应用场景后算法的持续迭代,都是基于共达地AutoML自动化AI训练平台完成的。也正是因为平台完成了原本依赖人力的80%的工作,所以才能让算法以天为单位迭代。
三是不仅交付效率高,人员投入还少。
在项目对接和交付过程中,主要由共达地项目负责人主导,没有算法工程师的参与,客户全程几乎零人员投入——这是许多AI厂商和产业客户共同期盼的分工方式。
这种分工背后,除了共达地AutoML自动化AI训练平台承担了80%的“黑盒”工作外,还有数据处理环节,曼孚、数据堂等专业服务服务机构的加入,让工作效率提升了许多;同时部署环节百余款主流芯片的提前适配,也让工时缩短了数月。
正是背后这一整套复杂系统,支撑了业务环节的简单交付。
定制VS标品
回到最初的问题:同样是算法商城,各家到底有什么区别?
事实上在这个案例中,共达地交付的不只是一款算法,而是一整套“软件平台+硬件设备+生态服务”的闭环能力。
在这个体系下,不论这个项目负责人来自共达地,还是集成商、政企客户,都不重要。因为“生产算法”这项工作,已经从高度依赖从业者的专业算法知识储备,变成仅仅需要了解业务需求和操作流程。这就像许多复杂仪器的生产,从老师傅手工打磨,进化为工业流水线。工人只需要知道如何操作机器,就具备了出色交付的基础。
而在这套能力内,软件、硬件、生态各个环节是互相扣合、依存的。当我们谈论“产业+AI”时,AI算法的大规模、高效率供应只是一方面,更重要的是,当原本离AI较远的传统产业,涌现出大量需求时,整个AI产业是否能及时提供客户随时可获得、到手即可用、应用成本低、全程服务支持的完整能力。
在这一点上,共达地的算法商城解决的是产能供应问题,与硬件、芯片、数据服务商等的生态合作,解决的是落地链路问题。
共达地:AI as a service
对于这种变化,AI”老炮“吴先生的评价是”先行者“。吴先生见过太多”黄掉“的需求,背后的原因也无外乎成本高、周期长、技术不稳定——这些都是AI落地的顽疾,也无一不依赖生态上的整合,如果这些问题不能被硬核地解决掉,就只能让AI赋能的梦想被湮没。
当整个完整生态聚合到一起时,客户不需要额外购买硬件、不需要费时费力处理数据,不需要为软硬件适配问题所导致的工时和人力成本买单,所有这些能在上游供应端通过合作共赢解决的问题,都不会流到下游成为客户的烂摊子。
也只有在有了生态支撑后,算法商城的轻型交付才具备了可行性。算法商城作为中转站,一方面承接基于AutoML自动化AI训练平台生产的海量算法,另一方面作为与产业客户沟通的平台。当客户选中某一款算法时,根据应用场景特征,数据服务前置到算法迭代过程中,硬件服务前置到算法部署环节中,产生基于标品的轻量定制——“标品”负责拓展AI与产业融合的边界,“定制”负责落地过程的丝滑适配,让算法商城从“死的算法交付”,变为“活的算法服务”,或许才能真正挠中产业客户真正的痒点。