竹间智能总裁兼COO孙彬:大语言模型如何在企业落地
风起AIGC
AIGC已经成为我们这个时代新的商业分水岭,引领着内容和创意的“寒武纪大爆发”。无论是前沿科技产业还是整个经济社会格局,都将因此产生巨大的变化。为了让创业者更好地拥抱这个时代, 创业黑马将以中国AIGC第一服务平台为己任,通过走访多位业内知名企业家、投资人、专家学者和创业实践者, 从软硬件平台视角、投资人视角、行业应用视角等维度进行系列报道,共话大模型时代新机会,展现产业新力量。 本篇为第八篇。
本期的分享嘉宾是 竹间智能总裁兼COO孙彬 。竹间智能由前微软(亚洲)互联网工程院副院长简仁贤于2015年创办,是认知AI时代下以大小模型双轮驱动的NLP为核心技术的国内领先人工智能企业,通过对话、知识、培训和生成四大产品平台,实现跨行业、跨场景的规模化落地,已累计服务500多家大中型企业。在以ChatGPT为代表的LLM(大语言模型)技术掀起全球浪潮之际,竹间对所有产品系列进行了全线升级,并推出运用多种LLM技术的成熟AIGC企业级产品,帮助白领等知识生产者提高生产力,助力企业完成数智化转型。
在6月8日的黑马AIGC主题系列直播第二季中,孙彬以 《大语言模型在To B领域的落地和探索》 为主题进行了分享,并展示了竹间智能在生成式AI技术落地方面的商业洞察、布局和重要成果。
以下为本次直播实录整理:
今天我来分享一下,作为NLP(自然语言处理)从业团队,过去亲身经历过的大语言模型发展历程,以及我们看到的未来。
我相信很多人都是最近在网上了解到 Chat GPT这种大语言模型,也分析过很多关于大语言模型和生成式AI的特点、优势或短板。但是其实大语言模型,包括我们所从事的NLP(自然语言处理)产业已经发展了很长时间了。竹间智能团队聚焦NLP已经有8年了,这8年也是NLP真正实现产业化的时期。在此期间,我们一直身处NLP赛道,研究如何将NLP服务商业化,如何进行营销,如何为企业提供服务,如何在C端实现成长,也积累了一些经验和客户。
01
行业变局与四大挑战
在人工智能领域,图像、语音、语义的处理都是一些重要的赛道,NLP就是其中关于自然语义理解的部分。
实际上,在人工智能的语义理解方面,具体可以分为两个部分:一是大家非常熟悉的人机问答,我们叫它 短文本 ,是用来交互的;另一个是 长文本 ,让机器能够对现有的非结构化的文件、文章进行阅读、理解、抽取、提取。这两大领域都是NLP的强势领域,也恰恰是产业化落地的领域。今天我们所熟悉的大语言模型,给大家展示了对话中的高理解、高对话能力,但它更让大家惊艳的地方却是生成的文章、写出的代码、翻译成的语言。
在这两大领域(短文本和长文本),过去各个NLP团队也取得了很多成果,但是在它们落地发展过程中,主要面临 四大挑战 ,而现在大语言模型的出现,则让情况产生了很大的改变。
首先,是深度语义理解及推理。 在大语言模型爆发之前,所有的语言模型相对来说都比较轻量,针对一些具体场景,那时首先面临的挑战就是如何能够准确理解客户的意思,大家都不断地在用新的模型优化算法,去了解客户的意图,理解客户的上下文和他们的情绪,但是现在大语言模型极大地拉升了这方面能力。
第二,是基于知识图谱的智能问答。 这也是现在大家对大模型最为诟病的地方,因为大模型的知识不是很准确。过去的最佳实践方案,是我们用NLP的模型去理解客户的对话意图,然后用客户方给到的知识和答案实现精准匹配,这样可以帮助对话机器人给出正确回复。
第三个挑战是如何通过语义训练实现问答精准匹配。 比如在金融行业,关于信用卡的服务内容其实是有标准答案的,但是客户的问法千差万别,我们如何用语言模型理解客户的意图是一个难题。在To B服务领域,对答案的准确度要求是非常高的,否则会对客户产生误导或造成损害,这一挑战依然延续到大语言模型时代。
第四个挑战,就是任务的流程。 大家知道,任何一个大语言模型的聊天能力都很强,但是你要让它完成一个工作,比如说办一张信用卡、重出一张机票,或查询一个工单信息,就有些困难。这种多轮的流程式的对话方式,对大语言模型来说可以很容易去模仿,但是要精准地提供这些数据,还需要另外一层的技术控制。
过去NLP产业落地的这四大挑战,现在依然还存在,但是在很大程度上来说,用大语言模型可以更容易地解决,这就是技术变革给产业带来的好处。在这方面,我们已经应用大模型做出了一些案例,获得了客户的认可。比如一家证券客户的客服中心原先使用的是传统的客服机器人,在使用中暴露出诸多问题,比如业务知识与闲聊混合管理不便于维护,大量知识材料内容和分组不匹配,回答准确率过低等等,40%~50%的电话最后还是要转到人工服务。但是经过技术的加持,机器人的服务占比可以提升30个百分点,就能很大地节约人力,提高效率。
所以,今天的 AI在应用过程中,特别是在To B产业,其实并不像大家想象的那样,一个模型就能够解决所有问题。它实际上是一个像下图这样的平台逻辑:
最底层是基础技术,上面是AI模块,还要通过一些API的方式进行二次开发,最后接入客户的业务场景。最近大家都把聚焦点放在大语言模型的写作能力和对话能力方面,但是从为企业服务的从业者视角来看,虽然目前底层的模型能力有了极大的突破,但要想更好地实现应用,还有很多的能力需要完善。
在今天这个大语言模型产业爆发之际,我们更呼吁所有在赛道中有经验的专业团队,都应该驾驭好大模型,让大模型能够在多场景中落地,实现产业化发展。 不但大模型自身要高速发展,大模型带来的创新业务也应该实现高速发展。
02
产业的未来
接下来,我来分享一下站在从业者的视角分析,大语言模型会给产业带来哪些变革?
首先想一下, Chat GPT现象的本质是什么 ,它给大家带来的经验是什么?相信所有跟它做过对话的人都不仅仅是为了好玩,大家会感觉到“我是在跟一个智能体对话”。这代表了什么?代表 人类可以跟语言模型进行沟通了。 它能理解你,能回答你,能帮你去执行。大语言模型最好的一点就是它用一种“暴力”的方式带来了足够多的知识,然后又可以理解人的情绪,可以跟人对话,这恰恰将以前人和机器交互的瓶颈问题解决了。
从这一点出发,我的 第一个判断,是大模型会改变我们现在的软件范式。 相信做IT的同事们对此都有切身体会,当PC出现的时候,当互联网到来的时候,当手机应用开始爆发的时候,软件范式都曾发生过改变,从工业软件到PC软件,到网站和手机APP,再到现在的大模型热潮,软件范式又将被改写一次。
那么,大语言模型来了以后,软件应用会是什么范式? 我们通过对话的方式就可以调动各种各样的应用。 如果说以前我们是应用为主导,今后我们可以非常明确地想象,人会跟手机或者智能硬件沟通,然后由它来完成相应的软件操作,所有应用之间的屏蔽会被打破,应用的能力会被调用,大语言模型直接调动应用能力会形成新的交互方式, 这将是一个新的操作系统,新的“iPhone 时刻”。
在未来2~3年内,我们大量的C端应用,都会因为对话方式的改变而改变,很有可能不再是触摸式输入,而是语音输入,很多行动也会打破应用的边界,可能每个手机都会有个AI助手,它可以通过对话的方式调度多个应用能力,下单、叫车、购买都可以通过语音来完成,接下来会有千千万万个基于类ChatGPT模型的应用出现。
以上是C端的变化,那么B端会怎样变化?我的 第二个判断是,在B端,企业/行业的私域知识会变得至关重要,产生大量的企业Chat GPT、行业Chat GPT。
目前,大语言模型的特点是它可以高度理解人的语义,并且可以做一些深层次的工作,比如写作、推理、分析等等,但是它的知识是不可被依赖的。这是因为用来训练的互联网数据是不可靠的, 今天的大语言模型实际上是一个对话模型,并不是一个问答模型。 它是为了对话而产生的,所以它会妥协,会认错,为了让对话继续进行下去,它会根据对话的人的喜好改变内容,但是它并不是一个具备正确知识的模型。
但对企业客户来说,我们的行业总监、客服、营销人员、政策咨询人员,绝对不能给客户不准确的知识。所以,在B端一定会发展成这样的范式:大语言模型做沟通和理解,加上私域知识——准确的私域知识——然后驱动行业/企业的应用,行业/企业的应用也会因为这一变化而变化。
那么,企业的私域知识怎样构建?我们可以回顾一下企业数字化的发展过程,最早的时候,我们把设备联网叫数字化,这是第一代的生产数字化;第二步,我们将ERP,包括生产制造系统使用起来,实现全业务流程IT化,这是第二代的资产数字化。
现在,我们有了大语言模型,有了行业/企业的私域知识,真正地让企业的hr部门、行政部门、销售部门、客服部门……所有的知识全部用对话或者阅读的方式表达出来,就真正让企业智能化了。
人工智能发展到一定阶段之后,可以将知识利用起来,就实现了进化, 我们将从数字化时代进化到数智化时代。
在接下来的时间,我们会看到越来越多的企业将部门的知识、企业的知识甚至行业的知识利用人工智能技术变成知识库,变成可以被AI构建和调用的知识,形成知识流,然后让这些知识变成数字人,服务我们的企业,服务我们的客户。
我们可以预测,在未来的一年,企业服务的这些内容会呈现指数级的增长,会提升至少10倍以上。从事To B行业的创业者,一定要对此做好准备。
03
未来的四个新挑战
那么,未来大模型发展将面临哪些新挑战?
除了前面提到的四大挑战之外,作为技术从业者,我在这里跟大家分享几个我们看到的新挑战:
第一个挑战就是大模型阅读 or 知识图谱预建? 过去我们做了很多的知识图谱,但是今天的大语言模型可以阅读文档,可以阅读那些非结构化的数据。那么,到底是不是还需要建立知识图谱?换一种说法,就是今天是要预设好答案,方便来问答和查询,还是要让大语言模型自己去阅读内容,然后给你答案?
其实,这两种实践路径都可以完成很多的内容查询,但是最终哪个效果好,哪个准确率高,我相信应该是不同的场景使用不同的模式。也许有人会问两种结合在一起会不会更好?答案很值得期待,希望我们的从业团队用工程能力给出结果。
第二个新挑战是“Prompt?Embedding?Fine-tuning? ” 这三个词都是现在特别热的词。Prompt是提示词,Embedding指嵌入接口,Fine-tuning指模型微调,都是训练大模型要做的工作。但目前其实并没有多少团队能够把模型调好,可能在微调的过程中间,越调越差。所以今天我给到大家的建议,就是不要迷恋对大语言模型进行微调,最终要以结果可控和高质量目标作为标准。利用大语言模型的能力加上自身的工程能力,比如对知识图谱、对客户数据的调用,然后利用数据的能力,最终满足客户的需要才是王道。
第三个新挑战,到底是应该做大语言模型,还是做专业模型? 我的观点是通用大语言模型有它的优势,专业模型也有它的场景,每个模型其实都有它的能力特点。我们认为通用大语言模型适合于To C端进行对话和训练,专业的模型适合于在行业内调取专业的知识,完成专业的任务。
第四个新挑战:大模型应该云端调用还是私域部署? 在10年前,大家就在讨论公有云好还是私有云好,其实我们看到今天这两者是并存的。云计算和AIGC产业发展有相似之处,通用模型适合于各种各样的中小企业,通用灵活;专业模型安全性高,数据可以控制,它要为企业服务,数据要准确,要完成不同的任务。所以我们可以这样预测,未来会有几个头部的企业提供最优秀的大语言模型来为大家服务,但同时也会有千千万万的行业私有云、企业私有云,千千万万的行业模型和企业模型。
未来,公有的大模型一定会越做越强,会由头部的几个企业来领导,行业的私有模型一定会百花齐放,这也是我们很多To B企业的商机。
我们相信,ChatGPT现象将给我们带来巨大的AIGC红利。写作类、绘画类、创作类的职业会实现巨大的提效。大模型归根到底是一个工具,会使用工具的人将会淘汰不会用工具的人。
智能家居行业会有很大的发展,过去每个家庭的环境太复杂,所以大家没有办法在家庭环境中预设好各种对话,现在大语言模型应用之后,对智能家居行业又会有很大的促进。
同样还有个人助手类的应用,我认为会有极大的发展。AI可以帮你订机票、订餐、更改日期,还有去执行一些预约,甚至去购买一些东西,我们期待着今年下半年会有很多个人助理类的应用大爆发。
此外,还有元宇宙的“ IP 众包”模式、情感陪伴类产品等等,都会迎来爆发。
竹间智能是2015年成立的一家NLP专业公司,我们的核心能力就是将短文本NLP和长文本NLP处理能力,结合我们的专业模型,以及现有的大语言模型,实现不同的应用场景落地,做出不同的数字员工,来为企业和个人提供服务。我们也希望能够跟行业内所有的玩家共勉,一起来享受 AIGC带来的产业爆发,共同做好AI在各个行业的落地。