对话领创智信:5年涉足10大国家,四大技术引擎助力东南亚企业的智能化转型

雷锋网  •  扫码分享

对话领创智信:5年涉足10大国家,四大技术引擎助力东南亚企业的智能化转型

“Think big”是领创智信技术研发负责人王芳林在采访中提及次数最多的词汇,某种程度而言,它已经成为了这家公司基因的一部分。五年前,正是这组基因的内生动力驱使着这家初出茅庐的初创公司,将目光放得更长远,率先瞄准了东南亚市场,并稳步扩张到南亚、非洲和拉丁美洲。

如今,领创智信已经先后在新加坡、中国、印度、印尼、越南、菲律宾设立办公室,服务超过800家行业客户,成为了新加坡独立科技创业企业中最耀眼的明星之一。

创业团队的两个“战术素养”

对于王芳林来说,“think big”至少有两个维度的涵义:

首先,在宏观战略层面要立足高远。“比如我们设计一款产品,首先要思考它是否有机会拓展到全球。如果可以服务全球客户,我们应该怎样来制定战略,团队应该是什么样的人员配比,跟合作伙伴要建立怎样的合作机制。”

其次,在微观技术实现层面,也要有全局思维。比如开发算法模型时,要先把横向和纵向的相关因素都思考清楚,而不是只看到眼前的一亩三分地。

王芳林的全局思维和他的职业发展路径不无关系。加入领创智信前,王芳林在新加坡本土的一家创业公司担任CTO,是个纯粹的技术派。2017开始,王芳林和领创智信的创始团队接触,但考虑到当时离开对原公司影响较大而作罢。而在经过一年多的观察后,王芳林最终选择了加入。

对话领创智信:5年涉足10大国家,四大技术引擎助力东南亚企业的智能化转型

领创智信技术研发负责人 王芳林

入职之初,王芳林的角色是某条AI产品线的负责人。“有点类似一个小型CEO的角色,不仅要管产品和研发,有时候还要和商务团队一起推动产品的商业化。”

后来随着公司发展壮大,为集中力量办大事,更好地服务客户,资源整合逐渐被提上日程。组织架构调整后,王芳林重新回到研发岗位,但这段特殊的经历却给他打下了深刻的烙印,使他看待问题有了新的视角。“也许正是因为这近三年全栈式的职业经历,我现在会主动地去做全局思维,和包括产品、运营、商务在内的兄弟团队合作起来会更加容易和顺畅。”

商场如战场,作为一名久经沙场的老兵,王芳林自然懂得“兵无常势,水无常形”的道理。市场瞬息万变,不管战略规划做的多么细致周到,终归是赶不上变化。所以他的“think big”其实还有后半句,那就是“act small”。

“作为创业公司,我觉得最重要的是不要怕犯错。方向性的东西是比较容易想到的,但它适不适合你当前所处的市场环境,这是书本和方法论没办法解决的问题。所以你需要做的就是小步快跑、快速试错,通过不断总结和复盘来来验证策略并让自己迅速成长。”

四大技术“引擎”驱动企业AI服务

加入领创智信三年,王芳林看着公司一步步发展壮大。如今他带领的技术研发部门已经拥有70多人的规模,虽算不上庞大,但也已经五脏俱全。

王芳林向雷锋网 (公众号:雷锋网) 介绍,他的部门包含四个团队——工程团队、数据标注团队、AI团队和数据科学团队,各自有不同的分工。

数据标注团队,顾名思义,其主要职责就是给数据加上标签。

目前行业内的数据标注团队主要有三种类型:一是AI公司自建的数据标注团队,二是专业的数据标注平台,三是承接数据标注服务的外包公司,三者各有优劣。

AI公司自建团队的人员素质更好、效率更高,但数据标注需求并不固定,维持一支庞大的数据标注团队性价比往往不高。

专业的数据标注平台相比自建团队拥有完善的产业链,具有盈利能力,能较好地平衡成本和质量。

此外,在国内三四线城市也存在一些承接数据标注服务的外包公司,由于劳动力成本较低,他们在价格上最具优势,但在标注质量和效率上存在许多不足。

领创智信的数据标注团队在建立时就希望能够发挥东南亚的低成本、高素质的人力优势,结合自身的AI经验,除了服务公司内部AI团队,也要具备承接外部项目的能力,结合三种不同类型数据标注团队的优势。

领创智信的数据标注团队负责人张新田认为,随着AI技术逐步发展和深入,数据标注势必将从简单类数据标注转向专业性数据标注,对标注人员的专业知识提出更高要求,数据的标注模式也将由劳动密集型转向AI辅助人力标注的新型模式。

因此,未来拥有专业数据标注能力的企业将展现出巨大优势。目前,领创智信已经在AI辅助标注方面取得了初步成果。“根据我们统计,AI辅助人工标注的方法可以将我们的效率提升75%。”

有了更好的数据基础和规模,才能为专注于AI算法模型的AI团队和聚焦于信用评分模型的数据科学团队提供更好的“养分”。

AI团队负责人余江波介绍,在领创智信聚焦的东南亚市场,计算机视觉等技术有着非常广阔的应用前景,尤其是在金融风控、反欺诈等领域。东南亚的金融体系发展起步较晚,各机构之间犹如信息孤岛,缺乏关联,很难实现统一化、集中式的征信管理。银行账户和信用卡持有率偏低,以及官方身份验证相关技术基础设施缺失,导致在做风控和征信时缺少相关技术与数据。

因此,引入计算机视觉等人工智能技术以防范各种金融风险就成为当地相关行业用户的迫切需求。

除了计算机视觉,信用评分模型也是金融机构应用AI技术频率最高的领域之一。判断一个信用评分模型好坏,稳定性是考量的重要维度之一。

数据科学团队负责人王争光介绍,领创智信的数据科学团队会从两个方面入手来保障模型的稳定性:一是覆盖尽可能多的样本,二是选择具有持续稳定性的数据特征来建模。

信用评分模型中的很多数据特征都是跟时间强相关的,因此选择具有持续稳定性的特征至关重要。特征的持续稳定性可以分成两个维度来看:一是分布的稳定性,即该特征在一段比较长的时间内,走势是比较稳定的;二是效果的稳定性,即一个特征现在是有效的,一年后依然有效。

通过这两种方式,目前领创智信的信用评分保证了模型的稳定性,同时AUC也可以实现业界领先的效果。

数据标注团队、AI团队和数据科学团队各具特色,不过单纯从规模来看,人数最多的还是工程团队,作为连接内外部的桥梁,工程团队肩负着双重使命。

对话领创智信:5年涉足10大国家,四大技术引擎助力东南亚企业的智能化转型

一方面,领创智信有先进的算法和模型,但最终交付给客户,还需要将其转化成简单易用的服务。工程团队负责人张云乐介绍,领创智信的产品交付有两种模式:

一种是云上部署的SaaS服务,用户登录账号后就可以非常简单方便地调用接口;另一种是私有化的本地部署,可以在安全合规的内网环境下快捷访问API。

“无论哪一种交付模式,客户都无需理解模型文件的内容,就可以轻松调用其背后的能力。”

另一方面,AI数据标注团队、CV+NLP团队和数据科学团队内部也有很多可以协作的地方,工程团队就承担一个中台、连通器的作用。“比如CV+NLP团队的OCR、人脸识别等产品会产生很多结构化的数据,是数据科学团队可以直接拿去用的。数据中台的作用就是把我们对数据的所有需求统一起来,实现内部共享”。

各个团队在开发和训练模型时需要处理大量数据,最常见的需求之一就是从数据中提取特征。为帮助大家更加方便地提取和管理特征,提高开发效率,领创智信的工程团队正在尝试搭建一个特征平台。基于特征平台,开发团队仅需要简单编程就可以获取到数据特征,实现低代码的敏捷开发。

技术研发负责人王芳林介绍,目前领创智信的技术研发团队仍在快速扩充当中,预计年底会增加到上百人的规模。

在一个快速成长的团队中,如何迅速让新成员融入进来,把大家拧成一股绳,对于管理者来说是个不小的挑战。从结果来看,王芳林胜任得还不错,团队战斗力十足,已经成了公司快速成长的重要引擎之一。

王芳林认为,企业管理可以划分成两个大的维度——战略和组织能力。战略决定了航行的方向和目标,而组织能力是这艘轮船能否有足够动力快速驶向终点的关键。

他向雷锋网表示,在大型企业里,管理者倾向于通过文化和规则来提升组织力,而在领创智信这样的创业公司,有一个因素比文化和规则更加重要,那就是企业和个人成长的协同一致性。

“很多人可能觉得这个很难,或者没有把它的优先级放得那么高,或者没有决心去做,但其实这才是非常重要的组织成长的驱动力。思考整个团队的发展方向,制定流程和组织架构时,这是我要考虑的核心要素之一。”

以金融为锚,在标准化和定制化间找平衡点

在技术研发团队的支撑下,领创智信已经将业务触角延伸到了多个领域,不过金融行业仍是其最主要的赛道。

王芳林表示,金融是AI技术应用最早的领域之一,信用评分和身份验证等技术很早就在欧美落地了。近年来,随着数字化程度不断提升,基于结构化数据进行线上反欺诈的需求也日趋旺盛。

尽管金融行业是AI的“先行示范区”,可东南亚地区互联网化程度较低的现状还是给金融AI技术的普及带来了一定的挑战。在国内,金融机构非核心业务上云已经是非常普遍的事情,而在东南亚地区受限于监管,更多采用的仍然是传统IDC的部署形式,不仅成本高昂,效率也有待提升。

同时,由于网络基础设施较差,领创智信在部署产品时也需要针对性地做很多优化。比如,针对图像、视频等多媒体信息,如何在最大限度减少对带宽消耗的情况下,实现精准的识别和判定。这些经验需要长期实践和总结才能一步步沉淀。

王芳林介绍,尽管深度学习技术是当前人工智能领域最大的热门,但在金融信用评分和反欺诈方面并没有特别广泛的应用。相反,传统机器学习技术要更加常见。其中一个主要原因是因为金融是一个强监管的行业,要求算法模型具备可解释性,而深度学习模型大多数情况下仍然是一个“黑盒子”。

同时,深度学习算法就像一个以数据为食的“巨兽”,需要大量数据的“饲喂”才能得到较好的运用效果。但金融行业受限于监管,企业能够使用的数据仍然比较稀缺。

不过他也乐观地表示,“深度学习算法在监管要求不高的领域仍大有可为,而且随着数据的积累和技术的迭代,未来深度学习算法也一定可以被解释得更加合理清晰,并在金融行业占有一席之地。”

AI团队负责人江波介绍,为了解决数据标签稀缺的问题,除了使用传统的迁移学习技术外,领创智信也在积极探索数据合成、半监督/无监督、主动学习等当下热门的人工智能前沿技术。

以图像识别领域的迁移学习为例,目前网络上有很多公开的图像数据集。这些数据可以作为“第一手资料”,帮助数据积累薄弱的初创公司迅速完成模型训练的“冷启动”。

领创智信经过近4年服务大量客户的实践经验,已经积累了不少数据,这些不同国家的数据通过迁移学习,可以帮助其在进入一个新市场时,迅速开发出适应新市场特性的模型和产品。

“就拿OCR来说,基于我们过去的数据积累,如果要开发一个新的证件识别产品,只需要1天。”

企业进入新的行业或市场时,除了面对数据稀缺的难题,也要经历对算法设计泛化能力的考验。

为了让算法模型具有更好的泛化能力,领创智信在做算法开发时就会强调算法模型的可复用性,抽出一些通过的模块来训练模。后续做进一步的产品开发时,只要将这些泛化的抽象模块像搭乐高积木一样搭起来,再针对不同客户进行上层的定制化开发,就能取得较为理想的效果。

作为一家深耕东南亚的出海企业,相比技术上的挑战,领创智信遭遇更多的还是业务上的难题。

和国内市场相比,海外市场的客户更注重产品全生命周期的标准化和合规性。但东南亚地区国家数量众多,不同国家之间的宗教、文化、政治、经济和技术基础设施差异显著,这又导致他们对于产品标准化和合规性的需求是不完全相同的。

王芳林说到,“早期我在做AI产品线的时候,非常强调标准化。但后来逐渐发现不同国家的客户在其特有的监管要求下,普遍拥有定制化的需求,这时候就不得不去做一些调整和改变。”

领创智信找到平衡点是,用标准化的方式做产品中间最通用、核心的部分,同时引入合作伙伴比如本地的系统集成商,客户定制化需求交给合作伙伴,达到客户、合作伙伴、自己的三赢。

某种程度而言,领创智信已经初步构建起了自己的生态,而“标准化产品+ISV定制开发”正是其生态的根本内核。再深一步说,这也是对于金融这个行业的认知和实践不断深入的过程。

结语

在AI独角兽们纷纷遭遇发展瓶颈的当下,领创智信能在短短五年内就在东南亚市场闯出一片天,绝不是用“幸运”两个字就能轻松解释的。

事实上,它已经在快速奔跑和大量的市场实践中总结出了自己独特的价值观和方法论。王芳林将其归功于公司的三个“Centric”文化——Customer Centric、Data Centric、People Centric。强调对客户需求的满足,以数据为中心,同时注重人才培养,寻求企业和员工成长的协同一致性。

王芳林表示,未来公司还将继续围绕这三大核心价值向前推进。至于下一个五年,他们能达到怎样的新高度,时间会慢慢给出答案。

随意打赏

提交建议
微信扫一扫,分享给好友吧。