行业观察|中国人工智能数据服务走向专业化·精细化之地
随着国家政策的倾斜和5G等相关基础技术的发展,中国人工智能产业进入快速增长阶段,人工智能广泛应用的 商业 化落地阶段来临。伴随着人工智能产业的发展,国内逐渐形成了以数据采集及标注为核心的基础数据服务行业。
国家工业信息安全发展研究中心发布的《2020年AI新基建发展白皮书》指出,人工智能算法的演进升级需要高质量数据作为支撑。经过清洗标注、去掉噪声数据的高质量数据集比未经过处理的数据集更适合人工智能算法进行训练。质量不断提升的数据集已经成为人工智能技术发展的重要推动力,高质量AI数据正驱动人工智能算法更加智能化。
据IDC《中国人工智能基础数据服务市场追踪报告》分析,积极参与数字化转型的客户群体都有 AI 数据服务的需求,其中标注质量、标注效率、知识经验、数据安全、整体成本五个维度,构成了用户对 AI 数据服务商的能力要求。
回顾过去,早期的AI数据行业曾长期处于粗放的发展模式,数据粗制、混乱、复用的情况屡见不鲜;但随着AI与各个产业结合得愈加紧密,AI商业化程度进入新的高度,行业属性较强的垂直领域加速落地,AI数据的需求正逐渐转向个性化、场景化和准确化,数据服务供应商的技术实力、精细化管理能力、流程把控能力不断提升,AI数据服务行业走向专业化、精细化、多维化。
从AI产业链的发展情况和未来发展趋势来看,中国AI数据服务行业的市场规模正在逐步扩大。一方面,随着算法模型、技术理论和应用场景的优化和创新,AI产业对训练数据的拓展性需求和前瞻性需求均快速增长;另一方面,随着行业内对训练数据需求类型的增加以及对服务标准要求的提高,产业链的专业化分工将愈加清晰,专业化的训练数据服务提供商将扮演更加重要的角色。
在由国家工业信息安全中心指导、中国电子商会数据资源服务创新专委会主办、北京赛昇 科技 公司协办的“信息技术大讲堂——数据治理实践案例解读专题分享会”上,云测数据总经理贾宇航结合实践案例指出,在人工智能数据市场中,数据服务商想要形成强劲的业务优势,就要摆脱同质化竞争,保持在模式、技术、服务等方面的不断发展:
一是加强场景化数据的采集能力,换言之就是为人工智能细分场景的落地,提供更加垂直且丰富的数据,满足其长尾场景的需求;二是提升数据标注的准确性,从工具、规则、流程的开发制定,到标注人员的素质培养,不放过任何可以提升标注准确性的可能;三是充分发挥“底层技术+服务能力”的力量,具备更深刻的行业领域知识、更懂场景、更懂技术、更具行业前瞻性。
以云测数据为例,我们会发现其已经建立了数据产品、数据处理工具与数据服务的“三螺旋”,为智能驾驶、智慧城市、智能IOT、智慧 金融 等行业提供高效率、高质量、多维度、场景化的数据服务与策略,最大化发挥训练数据的价值,为人工智能场景化落地输送更多数据支撑。这种对AI数据的质量、效率、场景化方面提升的要求,才能推动数据要素有序发展及高效利用,助力企业在“百家争鸣”的智能化浪潮中迎头而上。
当前,不管是人工智能技术的研发以及应用领域的发展,“数据”都是一个不可或缺、位于重中之重的因素,以数据价值驱动的数字 经济 正成为推动社会前进的主要模式。AI数据作为新的生产要素声名渐显,它是人工智能长期发展的重要保障,人工智能技术研发、训练的关键。只有当AI应用获取了更为准确、及时、一致的高质量数据,才能提供更有效、有用、精准性高的智能化服务。相信随着AI数据服务行业的高速发展和规范并举,AI数据价值将进一步飞跃,人工智能产业落地进程将大步平稳向前。