大数据语义分析公司“Image Q”,业务包揽政府、企业、媒体
36氪此前曾报道过大数据公司“Palantir” ,这家估值200亿美元的公司也引来国内诸多初创企业对标, Image Q 正是其中之一。它是武汉烽火科技集团内部孵化的项目,定位做互联网大数据语义分析应用的平台,可以实时抓取微信、微博等全渠道数据,再结合政府、运营商等第三方数据,根据知识图谱,将其中的中文数据进行智能语义分析,应用于不同的行业中。
目前 Image Q 的业务主要应用在4种场景下:1、舆情监控;2、商情监控;3、媒体热点追踪;4、人工智能报告。
舆情监控服务主要是面向政府 ,Image Q 通过分析抓取数据并做出“正面、疑似正面、中立、负面、疑似负面”的数量反馈,来辅助政府、企业依据舆情做出相应调整。目前Image Q分析识别的是文字信息,对于图片则也是转化成文字来处理,至于视频识别之后也会提上日程。
商情监控 则是针对企业, Image Q 可以结合全网数据和工商数据帮企业分析竞品及市场的动态。比如说,周黑鸭与绝味、久久鸭脖等等竞品趋势对比状况如何?此外,还能够根据一定算法计算出企业的品牌指数。
同时, Image Q 的能力还可以输出到媒体行业,帮助其 监控 预测可能成为‘爆点’的内容 ,尤其是微信、微博等碎片化渠道。 36氪此前报道过将传媒内容和大数据技术结合的“热巢” ,两者业务有类似之处。
并且, Image Q 还可以将上面的分析 生成 智能报告 ,用户可以自定义搜索添加需要的舆情信息作为报告素材,并将数据以可视化图表的方式呈现,再辅以人工加观点的形式,能在一定程度上简化用户进行信息抓取、挖掘和可视化包装的流程。
此外,平台能帮助广告主监控直播传播效果,以规避直播平台的作弊行为。
但赛道上类似的公司已不在少数,问及Image Q的优势,其CEO金俏强调,首先,从 数据来源 的角度来说,Image Q背靠有央企属性的武汉烽火科技集团,可以拿到政府、运营商的数据。
再者,在技术上 Image Q拥有自主知识产权的NLP语义分析技术 ,其大致流程是基于大数据词库辅以行业语料库,通过关联学习、知识图谱以及相似度计算等方法实现智能语义分析,进行情感判断。她表示,在特定场景下的正负面情感分析准确度达到80%-90%,经过行业数据标注学习后准确率可达90%-95%。
此外,由于同一个词语在不用行业的中表达的意思不一样,所以需要建立行业知识图谱来对机器进行训练,可是完善这个图谱不是易事,Google、IBM都铺了大量人力、时间在做,那么创业公司怎样去做?对此,金俏表示,首先他们瞄准政府等几个特定的行业,这样图谱的范围就可以缩小,另外他们采取人机结合的方式,可以通过政府的舆情专家、 人工打标签和一些学生采集员来进行修正完成。
据了解, Image Q团队目前80多人,其中技术专家团队有70多人,平均学历硕士以上。此外,公司正在进行A融资,未来计划5年内独立上市,迄今公司处于‘保本状态’,金俏表示希望有更多资本介入以扩充技术团队占领市场。