AI数据服务行业TOP1的背后,云测数据到底做了什么
人工智能的基础理论由来已久,由深度学习引爆的第三次人工智能浪潮,以及算力的进步和数据的爆发,使得人工智能技术快速走向成熟,并逐步落地产业应用。目前,人工智能技术在 营销 、 金融 、数字政府、零售、医疗等行业的落地持续推进,并开始带来显著的效益。
这些人工智能成果"翩翩起舞"的背后,不得不提到“数据”为AI落地提供的底层支撑与价值。AI数据采集标注是人工智能三大构成要素之一——“数据”的处理环节,它随着AI产业需求发展进行着快速发展,目前处于规范化成长的阶段。
近日,《 互联网 周刊》&eNet研究院、德本咨询联合发布了《2021数据标注公司排行》,又一次将AI数据服务产业推到了人们眼前。我们通过剖析本次排行榜TOP1服务商——云测数据,来了解AI数据服务产业的发展脉络及未来趋势。
据《2020年中国AI数据服务行业研究报告》预测,中国AI数据服务行业正在加强专业化发展,随着人工智能产业落地需求升级,理念更先进、技术更硬核、效率度极高的专业AI数据服务企业将成为主流趋势。
云测数据作为Testin云测旗下AI数据采集标注的一个业务品牌,以高质量、场景化的AI数据服务而出名,拥有行业首创的数据场景实验室和自建数据标注基地,为智能驾驶、智慧城市、新零售等众多领域提供高质量的数据采集、数据标注服务。
首先,在雄厚实力的加持下,云测数据在人工智能所需要的视觉、语音和文本三大数据类型上实现了更高精确度的支持。在2020年的中国创新 创业 成果交易会上,云测数据正式向业界发布了他们在AI领域的最新成果——AI数据项目的最高交付精准度已近提升至99.99%。这个数字标志着,“数据”作为人工智能三大基石之一,已近迈入了高品质时代。从此,云测数据在行业内外也就成了高质量AI数据的代名词。
以视觉类型的数据为例,云测数据的标注精度可以完成多高呢? 据云测数据总经理在某次采访时透露,“一张人脸需要你准确地在内眼角上标注人脸关键点,在图片上,内眼角也就不到100像素,而任务还会到标注到具体哪个像素上。”
其实,高精度的数据标注仅仅是AI需求复杂度上升的后半程的要求,人工智能对数据高质量的需求同样体现在数据场景化的采集上。,随着人工智能技术的不断成熟,更多的场景和行业开始嵌入使用人工智能技术,AI行业应用场景逐渐趋于长尾和碎片化,产生了大量新兴垂直领域的数据需求,如疫情期间的口罩识别应用等。
为了进一步攻克场景化数据这一难题, 云测数据开创“数据场景实验室”,成为行业内第一个规范化进行场景化数据生产的数据服务商。如为了进行多角度多姿态的采集任务,云测数据专门在横店设置了“数据场景实验室”,进行特定动作和表情的捕捉。据了解,云测数据也是目前唯一聘请群众演员进行人工智能数据采集的公司。
如在音频领域,为保证音频数据采集的质量,云测数据开发了“音频检测”功能,通过对音频的底噪和能量值进行检测,来保证底噪和能量值在阈值范围之内。这种预处理方式可大幅提升数据的采集质量并切实提升数据采集的效率。
人工智能越深入发展,数据资产的重要性就越高,尤其是AI数据更加立体和丰富、精准度到达一个新的高度后,AI数据的价值变得更高,数据安全就更加成为客户企业的刚需。对数据隐私安全的重视,导致不少数据标注企业至少在数据安全维护方面拥有可圈可点的技术耕耘,甚至不输于其他被打上技术公司标签的巨头。
一个现实是,像云测数据这样的头部企业,数据精准度、场景化做得越好,就更看重数据隐私安全的保护。这些对数据安全的重视,是其实现高效的作业效率,甚至不断引导行业的规范化发展的前提原则。据了解,除了流程和工作方式的严格控制,云测数据内部还开发了数据隔离、质量保障等一系列数据安全方面的技术,这也使得数据标注企业的“技术”标签更加浓厚。
Testin云测CMO张鹏飞也强调,“从目前看来,AI数据行业关于安全、隐私等方面并没有统一的标准。但从我们长远角度出发,一直在隐私和安全防护角度下大力气服务行业、树立数据质量标杆,只有以这种负责的态度来服务客户,我们的行业才能‘良币驱除劣币’,真正让人工智能成为新一轮技术革命,改变整个社会和人类进程”。
当前,行业头部企业将数据质量提升到一个“顶尖”时,马太效应将愈发突出,企业间差异化趋势愈发明显。对于人工智能相关的企业来说,AI数据是否优质关乎着企业效率、用户感受、价值回报等等,这也是以云测数据为代表的AI数据服务商们需要共同发展一起解决的问题。