大数据百嗑 ▏非结构化数据是什么?
非结构化数据主要是指那些无法用固定结构来逻辑表达实现的数据,简单来说就是用户散落在论坛、微博、微信或其他渠道发表的关于产品的各种评价或吐槽。国内的企业级客户在进行大数据分析时,仍以分析结构化数据为主。
从形态上,非结构化数据主要包含三大块:第一是文本文字;第二是图像、图片等;第三是视频流、电视流。
和结构化数据相比,非结构化数据最本质的区别包括三个层面:非结构化数据的容量比结构化数据要大;产生的速度比结构化数据要快;数据来源具有多样性。
据IDC的调查报告显示,企业中80%的数据都是非结构化数据。
注:本文系数据观原创稿件,转载请注明来源。
☞点击此处进入2016数博会专题报道页面:
http://www.cbdio.com/zhuanti/node_6623.htm
责任编辑:陈近梅