生成式AI时代,亚马逊云科技助力构建企业生成式AI三大核心能力 | 速途网
速途网讯 数据是生成式AI的基石。生成式AI的基础模型诞生于大规模、高质量的数据集,现今的模型已经达到了前所未有的规模,这为企业提供了强大的基础。然而,数据与基础模型的结合才能产生真正的价值。通过将企业内部数据与基础模型结合,企业可以创造出独特的应用,满足用户需求,提高用户体验。同时,企业需要高效管理这些新数据,确保它们能够为应用的持续发展提供支持。
近日,亚马逊云科技 “无数据,不模型——生成式AI时代的数据基座”技术媒体沟通会在京成功举办。沟通会上,亚马逊云科技重点介绍了在数据基座构建方面的核心能力和解决方案,以及企业在生成式AI时代构建数据基座的重要性和必备条件。
亚马逊云科技大中华区产品部总经理陈晓建表示:“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。亚马逊云科技构建数据基座的三大核心能力涵盖从基础模型训练到生成式AI应用构建的重要场景,能够帮助企业轻松应对海量多模态数据,提升基础模型能力。作为全球云计算的开创者和引领者,亚马逊云科技正在帮助各个行业、各种规模的企业打造强健的数据基座,在确保用户业务和数据安全的前提下,将数据的独特价值赋予基础模型和生成式AI应用,加速企业业务增长。”
亚马逊云科技构建的数据基座具备三大核心能力:第一,为模型微调和预训练提供高质量数据处理能力。这包括了数据存储、清洗和治理,而亚马逊云科技的各项服务,如Amazon S3和Amazon Glue等,为企业提供了高效、快速的数据处理方案。
陈晓建指出,生成式AI基础模型诞生于大规模、高质量数据集。如果一本书按500KB算,现在的500T参数的模型已经有332亿本,相当于现存每个人类拥有4本书。数据结合基础模型会产生独特价值,企业需要高效管理飞速发展的生成式 AI 应用产生的新数据。
例如亚马逊打造的Rufus,作为一款以生成式AI为核心的专业购物助手,能够解答客户的购物疑问、提供产品比较,并根据对话情境进行推荐。它将为亚马逊商城超过2亿的Prime 会员提供服务,在提升客户体验的同时也会产生大量新的数据。
第二,是将数据与模型快速结合,让企业专有数据释放更大价值。目前,通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练。RAG的数据来源是企业内部文档库、数据库、数据仓库、知识图谱;微调数据来源为私域知识;持续预训练数据来源为公开的数据集或企业各部门的数据。
亚马逊云科技将向量搜索的支持功能加入到主流的数据服务中,通过将数据和向量存储在一起来提升数据查询性能。这能够让企业轻松利用RAG技术将专有数据提供给基础模型,从而释放更大价值。此外,亚马逊云科技还为图数据库Amazon Neptune推出了分析数据库引擎,以结合图数据库与大模型的优势,从而能够快速从图形数据中获取洞察,并进行更快的向量搜索。
第三,有效处理生成式AI应用的新数据,降低模型频繁调用成本并提升性能。亚马逊云科技推出了Amazon Memory DB内存数据库和Amazon OpenSearch Serverless服务,其中。Amazon Memory DB内存数据库通过缓存之前问答生成的新数据,实现对类似问题的快速响应和准确回答,同时有效降低基础模型的调用频率。Amazon Memory DB能够存储数百万个向量,只需要几毫秒的响应时间,能够以99%的召回率实现每秒百万次的查询性能。
会上,北京灵奥科技CEO厉启鹏与店匠科技(Shoplazza)首席科学家谢中流博士也进行了演讲,分享了企业运用亚马逊云科技的相关技术实现业务赋能的更多实践。
在交流中,谢中流指出 Shoplazza的核心业务就是帮助商户建立独立的电商平台,已服务了超过36万跨境电商客户,覆盖了全球150多个国家,其中40%的消费者来自于欧美地区。
通过亚马逊云科技的强大基础设施和技术支持,Shoplazza得以实现海量营销素材的存储和管理,为模型训练提供数据支持,以及通过分布式任务和流式计算技术实现实时数据处理和清洗。亚马逊云科技的各项服务,如Amazon S3、Amazon EMR、Amazon OpenSearch等,为Shoplazza提供了完善的技术基础和数据支持,使其能够更好地满足用户的需求。
此外,Shoplazza也在探索与亚马逊云科技在AI领域的更深度整合。通过引入生成式AI技术,Shoplazza开发了一系列创新产品,包括BetaCreator营销素材创作工具、智能建站服务、智能客服解决方案以及智能推荐与搜索等。这些产品的引入,大大提高了电商营销素材的创作效率,简化了网站建设流程,并实现了智能化的客户服务和个性化的推荐与搜索功能。
厉启鹏在演讲中表示:“如果企业能够解决好数据问题,就能够解决大部分AI应用落地的核心挑战。”他指出,企业在构建AI应用时面临诸多挑战,包括业务数据的理解、数据的质量和安全合规等方面。
他还强调了数据在实时业务决策中的重要性,并提到了与亚马逊云科技的深度合作,使Vanus得以基于亚马逊云科技的强大基础设施和技术支持提供更优质的服务。例如帮助ERP企业通过Vanus AI构建AI Copilot,提升客户服务效率;或是帮助服饰电商企业利用VanChat提升销售和客户满意度。
厉启鹏还介绍了Vanus如何利用亚马逊云科技的各项服务,如Amazon S3、Amazon DocumentDB等,实现海量数据存储、实时业务感知和数据处理等功能。他表示,借助亚马逊云科技的弹性计算和高可用性服务,Vanus能够实现企业客户的高效运营和成本节约。
通过为企业提供先进的数据处理能力,亚马逊云科技推动企业在生成式AI应用领域的发展,为全球用户提供了更加优质的音乐体验。厉启鹏表示,未来他们将继续与亚马逊云科技合作,在模型领域和数据库领域深化合作,探索更多创新解决方案,为用户提供更好的AI产品和服务。