决定AI落地程度,高质量数据为产业智能化保驾护航
自从2012年深度学习在图像和语音方面产生重大突破后,人工智能便真正具备了走出实验室步入市场的能力。时至今日,人工智能的 商业 化在中国得到了长足发展,在安防、 金融 、企服等领域纷纷落地开花,同时也真正意义上衍生出了一套完整的产业链。
AI产业链可以分为基础层、技术层和应用层,基础层按照算力、数据和算法再次划分,对整体上层建筑起到支撑作用;技术层根据算法用途分为计算机视觉、智能语音、自然语言处理等,是AI最引人注目的环节;应用层则按照不同场景的需求定制开发专属服务,是AI真正赋能行业的方式。目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点,需要大量经过标注处理的相关数据做算法训练支撑,可以说数据决定了AI的落地程度。
据了解,目前一个新研发的计算机视觉算法需要上万张到数十万张不等的标注图片训练,新功能的开发需要近万张图片训练,而定期优化算法也有上千张图片的需求,一个用于智慧城市的算法应用,每年都有数十万张图片的稳定需求;语音方面,头部公司累计应用的标注数据集已达百万小时以上,每年需求仍以20%-30%的增速上升,不仅如此,随着IoT设备的普及,语音交互场景越来越丰富,每年都有更多的新增场景和新需求方出现,对于标注数据的需求也是逐步增长。
回顾过去,早期的AI数据行业曾长期处于粗放的发展模式,数据粗制、混乱、复用的情况屡见不鲜;但随着AI与各个产业结合得愈加紧密,AI商业化程度进入新的高度,行业属性较强的垂直领域加速落地,AI数据的需求正逐渐转向个性化、场景化和准确化,头部数据服务供应商的技术实力、精细化管理能力、流程把控能力正在不断提升。
针对AI数据高质交付背后的服务、技术与流程等方面内容,云测数据总经理贾宇航在公开场合表示,随着人工智能产品的迭代,AI数据的演进过程也伴随着自身选择的演化,体现在数据多维化、场景多元化、样本多样化、内容专业化、作业精细化、作业高效化等方面,在人工智能数据市场中,数据服务商想要形成强劲的业务优势,就要摆脱同质化竞争,保持在模式、技术、服务等方面的不断发展。
作为人工智能数据服务领域头部代表厂商,云测数据在早期就已关注到AI数据服务的需求缺口和潜在的应用市场,立足高质量、场景化的AI训练数据服务,率先形成AI训练数据的“采、标、管、存”一站式服务,实现了从“数据原料”到最后的“数据成品”全链条打通并通过数据产品、数据处理工具与数据服务的“三螺旋”,为智能驾驶、智慧城市、智能IOT、智慧金融等行业提供高效率、高质量、多维度、场景化的数据服务与策略,最大化发挥训练数据的价值,为人工智能场景化落地输送更多数据支撑。
近年来,云测数据更是站在AI数据服务发展前沿,以技术创新加速行业发展为己任,通过推出“云测数据标注平台”、“AI数据集管理系统”等技术成果,为AI相关企业提供处理大规模感知数据的能力,通过结构创新、智能化、工程化、标准化的标注平台产品赋能AI训练数据行业,持续为计算机视觉、语音识别、自然语言处理、知识图谱等AI主流技术领域提供高价值数据支持,进而推进AI产业的场景化落地。
结合市场来看,随着AI商业化发展,AI数据服务需求步入常态化,AI数据作为新的生产要素声名渐显,它是人工智能长期发展的重要保障,人工智能技术研发、训练的关键。相信在未来,云测数据将持续保持自主创新性,坚持与时俱进,更好的为人工智能提供高质量、场景化的数据服务。