标贝科技亮相WIM2023 分享大模型技术在数据标注领域的应用
近日,由亿欧、中关村国家自主创新示范区展示中心、中关村会展与服务产业联盟联合主办的WIM2023创新者年会在北京中关村国家自主创新示范区展示中心颐和厅成功举办。标贝 科技 受邀亮相大会,联合创始人&CTO李秀林做了“大模型技术在数据标注领域的应用实践”的主题演讲,与众多行业专家共同探讨大模型技术在构建人工智能产业生态的 商业 价值。
作为中国科技领域最有影响力的大会之一,2023世界创新者年会围绕“穿越波动,韧性前行”主题,通过主题演讲、巅峰对话、榜单发布等形式,邀请近百位重磅嘉宾,聚焦新能源算力数智 经济 、数据革命、人工智能、低碳科技等多个主题,洞察2024前沿发展趋势。
大模型时代 国 内基础数据服务 迎来 百亿市场规模
伴随大模型时代的到来,以数据为中心的AI开发模式加速走向台前,数据价值被充分挖掘。大模型从训练到部署应用迭代,AIGC众多垂直场景落地,通用智能、具身智能等前沿领域探索,都与高质量、专业化的场景数据密不可分。
作为底层基础服务,数据标注也越来越受到关注。据量子位智库发布的《中国AIGC数据标注产业全景报告》指出,当前数据标注正处于重新洗牌时期,更高质量、专业化的数据标注成为刚需。未来五年,国内AI基础数据服务将达到百亿规模,年复合增长率在27%左右。
标贝科技数据大模型 赋能大模型技术产业落地
成立多年来,标贝科技始终将技术引领作为发展第一要位。面对纷繁复杂的市场变革,标贝科技基于丰富的行业和细分场景业务经验,构筑了全方位的AI能力体系,为大模型相关算法和技术研究奠定了坚实的基础。
大会现场,标贝科技联合创始人&CTO李秀林博士向与会嘉宾详细介绍了数据大模型的技术特点与应用能力。
标贝科技数据大模型聚合了多年沉淀的行业经验和专业技能,通过深度优化的算法技术,具有智能化多领域数据标注处理能力,赋能数据生产全生命周期管理,更快更多地给予AI应用数据养料,为更多场景大规模落地提供支持。
借助大模型高自动化、高精度、高效率优势,目前标贝科技AI数据平台可以全方位支持音频、文本、图像、3D点云、4D-BEV等多模态数据的自动化标注。在确保标注结果的高准确率前提下,相对纯人工标注,效率可提升70%以上。
例如,在自动驾驶4D-bev标注场景下,标贝科技借助机器视觉算法能力,实现对上亿点云数量及2万帧机位图的流畅加载和标注操作,支持对车辆、行人和路标等目标进行多视角、多时序的标注,提供更加精准的目标位置、速度、姿态和行为等信息。
在3D点云数据标注项目中,标贝科技通过模型的调参,实现点云数据的精确分割和处理,获得更加准确和精细的物体模型和场景信息,对车道线,路沿等高质量识别,提升标注效率。适用于机器人导航、自动驾驶、三维重建、虚拟现实等领域。
在语义标注上的应用场景下,标贝科技2D图像标注平台支持对百兆级别的超大像素图片进行高精度标注,自动识别、标定和描述超大像素图像中的所有细节,并在几秒钟内生成完整的图像标注结果。可以为自动驾驶、遥感图像、医疗影像、虚拟现实和增强现实等专业领域提供更准确、更可靠的数据支持。
在语义搜图应用中,标贝科技推出大模型图像清洗工具,对海量图文数据训练,提取有效图像视觉特征,然后借助大模型对每张图片进行向量化处理。通过这种生成式逻辑去对比图库里的特征向量,从而“理解”自然语言描述下的图像,为用户提供快速、高效、准确的图像搜索和管理体验,解决传统图像搜索中搜不到、搜不准、搜不快等难题。
在大会现场展台区,标贝科技还为与会嘉宾全方位展示大模型核心能力在各行各业赋能的最新探索,吸引了各领域专家学者和技术人员前来交流洽谈。
大模型发展浪潮的背后是数据、算法、算力的合力推动。随着未来数据处理技术的不断发展,能够获取和处理的数据量更大、质量更高、种类更多。标贝科技也将进一步优化平台工具链,为客户提供更专业的数据服务,解决AI落地场景多样性、复杂性的数据需求,拓宽更多场景的应用空间,推动人工智能领域的发展。