从线上数据看2017年上海车展
2017年4月19日,汽车行业的年度盛事——上海车展在国家会展中心(上海)正式开幕。本次车展延续10天,至28日圆满落幕。上海车展每两年举办一次,和北京车展一样,是全国顶级的车展活动,并正迈向世界A级车展行列。
本年度的上海车展有千余家来自世界各地的汽车厂商参展,并吸引了大量的公众和媒体关注。据官方统计,本年度的参观人次达到101万次,有万余名记者参与了车展的报导。
在移动互联网背景下,对车展的参与也远远超出了会场的范畴。除了传统媒体,互联网媒体、自媒体等新媒体也纷纷参与到对车展的报导中;广大网友也通过直播互动、论坛讨论等方式间接地参与到车展中。新媒体和线上参与所涉及的人数之广、互动之频繁也超过了以现场参观为主的传统参与方式。在本文中,我们试图从线上直播采集到的弹幕数据出发,来展现线上参与者对上海车展的期望与印象。
从线下到线上:自媒体和直播崛起,线上受众远超线下
除了传统媒体在现场的报导,互联网媒体纷纷发力,创建了自己的上海车展主页。例如,百度推出“车展温度计”,从百度指数角度反映车展期间的品牌热度变化;汽车之家、新浪汽车等也推出上海车展专页,提供信息查询、新闻报导等服务。
但是,今年上海车展的最大变化来自于报道方式的变化: 大量的自媒体和互联网媒体开始通过以直播的方式实时带领线上观众参观车展,并和观众互动。 我们统计了新兴直播平台“一直播”下参与直播上海车展的主播,得到了综合影响力前五的主播:
可以看到,排名第5的主播1天观看人次就超过车展现场10天的总参观人数,更不用提排名第一的王兮兮主播高达900万(3天)的观看人次。而一直播只是目前国内的主流直播平台之一,由此可见自媒体和直播在本次车展中的影响力之大。
此外,我们也研究了“上海车展”百度搜索用户的画像。从搜索需求来看,大部分搜索用户以“时间”、“门票”、“官方网站”等为搜索需求;因而可以认为,“上海车展”的百度搜索用户基本上代表了线下观众或者有意去上海本地参加车展的观众。另外,我们以汽车之家对上海车展的直播报导的观众作为线上观众的代表,来比较线下和线上观众的画像。下图分别展示了“上海车展”百度搜索用户的地域分布及汽车之家直播观众的地域分布:
可以看到,有意到现场参与上海车展的群众主要分布在上海本地和周边的江苏、浙江两地,江浙沪三地的群众构成了上海车展现场观众的主力;在这三地之外,只有北京和广东有较高的分布,其他省份的群众非常少。而视频直播的辐射范围则要广得多,几乎全国各省份都有一定程度的涵盖,而其中以广东、山东、江苏、云南等省份居多。由此看见,通过互联网和直播,上海车展的受众得到了极大的拓展。
国别和类型:国产车占据半壁江山,SUV超越传统轿车
汽车之家也在19日、20日两天对上海车展做了直播报道,主持人带领观众对主要的参展车辆都进行了较细致的介绍和镜头展示,总观看人次达到158万,弹幕总量达到30万。我们爬取了这场直播所有的弹幕,并通过对这些弹幕进行文本挖掘,通过计算不同国别、类别下的车型的提及次数,得出不同国别、类型的关注热度。
首先是不同国别下的品牌关注总数:
可以看到,国产自主品牌的总提及数占到所有参展品牌的一半以上,体现了国产自主品牌在近年来的逐步崛起。排在其后的是日本、德国、美国三大汽车生产国。而韩系车可能由于受到萨德事件的影响,提及数在本次车展中垫底,不仅远不如日德美这些竞争对手,甚至也比不过瑞典、捷克等国。
轿车和SUV是本次车展的绝对主力,占到提及总数的90%以上。下图展示了不同大小类型下的轿车和SUV的提及总数:
可以看到,近年来大受欢迎的SUV在本次车展上的关注度已经超越经典轿车了,尤其是在中型、紧凑型等型号上的关注度与传统轿车相比优势十分明显,可见SUV成长速度之快和受欢迎的程度之深。其中,首次亮相/上市的几款SUV更是获得了热烈关注,预示着今后SUV仍是大热。
最受关注品牌与车型:领克01和WEY VV7竞争首席新车
同样基于对弹幕数据的文本挖掘,我们提炼出观众对于各个参展品牌和车型的提及次数,并制作出最受关注品牌和车型榜单。
首先是提及次数最高的品牌前20名:
可以看到,排名最靠前的品牌是哈弗。哈弗是国内厂商长城旗下的品牌,其下的哈弗H6曾缔造了销量奇迹。第二是本田,除了本田已有的车型外,新款的本田CR-V也在本次车展格外得人眼球。第三和第四都是全新的品牌:领克是吉利汽车新推出的高端紧凑型SUV,领克01在本次车展中首次亮相;而WEY则是长城新推出的品牌,WEY VV7在本次车展中正式上市。
在对车型的排名中,我们区分了已经上市/发布的车型和在本次车展中首次亮相/上市的车型。下图为已经上市/正式发布的车型提及最高的TOP10:
其中,广汽传祺GS7位列已经上市/发布的车型中的第一位,跟在其后的是五菱宝骏310和大众CC。即便是对于已经上市/发布的车型,直播观众也更喜欢提及发布不久(如:广汽传祺GS7,2017年)和上市不久(如:大众CC,最近一款为2016款)的较新的车型。
下图为本次车展首发车型(首次亮相/上市)的提及次数排名前十:
最突出的是,领克01、WEY VV7和新本田CR-V以4000次以上的提及次数位列新车型前三甲。领克01和WEY VV7的领先,展现了这两款分别由吉利和长城力推的主打中高档价位的SUV在本次车展中获得了巨大的关注。紧接其后的新本田CR-V和新别克君威作为之前就广受欢迎的车型的改进版,也获得了较高的关注度。
新车印象:总体不错,便宜、豪华、安全等成为关键词
在车展上首次推出的车型往往引发汽车爱好者对于该车型的大量讨论,观众对于首次亮相的印象也往往对该车型日后的销量有所影响。我们爬取了上述最受关注的5款首发车型(领克01,WEY VV7,新本田CR-V,新别克君威,阿尔法罗密欧Stelvio)的汽车论坛在车展期间的所有评论,并针对每一条评论使用TF-IDF算法提取词性为形容词的关键词,并以此为基础,总结线上车友对这些车型的第一印象。
在剔除掉和车本身无关的形容词后,在对这五款车的评论中,较多地使用了以下词语:
可以看到,车友对于这五款车的评价大多为正面:除了“一般”这一中性词外,其他使用频率较高的均为正面词,例如“便宜”、‘豪华’、“舒适”、“安全”等。其中,“不错”一词使用频次最高,成为车友最常用的评价词。为了进一步了解这五款新车在不同方面的印象,我们将词语划分为“总体”、“价格”、“外观/设计”、“性能”等四类。
下图展示了被划分为“总体”类型的词语的占比:
在对这些车型的整体评价上,“不错”一词占到了73%;其后的是“厉害”、“完美”、“诚意”等更为正面的词语。而“及格”这一负面词的评论不足0.1%。
其次是关于“价格”、“外观/设计”和“性能”三方面的词语的提及占比:
在价格上,“便宜”以79%的绝对优势位列第一。这说明,即使是在有两款定位较高的车型(WEY VV7和领克01)在内的情况下,大多数车友仍然认为这几款车较为便宜。另外,在外观和设计上,“豪华”一词以44%的占比位列第一,而“豪华”的评论主要由领克01和WEY VV7两款车的论坛评论贡献,反映了近年来国产品牌越来越追求品牌的升级。“豪华”与“便宜”同在,反映了这两款车在中端的品牌定位和相对合适的市场价格上取得了较好的平衡。最后,在性能上,“安全”以近半数的占比位列第一,“舒适”和“舒服”也获得了较多的提及,“稳定”位列第三。
新车展望:领克01和WEY VV7互打擂台,CR-V最受日系车迷关注
为了对新车日后的发展做进一步的展望,我们通过挖掘不同车型之间的关联规则来探索几款新车的活力。在关联分析中,常用的两个指标为支持度计数(support count)和置信度(confidence)。以经典的“啤酒、尿布”关联的例子为例,“啤酒、尿布”这一集合的支持度计数是指同时购买“啤酒”和“尿布”的人的数量;而“啤酒、尿布”的置信度是指同时购买“啤酒”和“尿布”的人数和只购买“啤酒”的人数的比率(注:和统计上假设检验的“置信区间”并不相同)。支持度计数反映“啤酒、尿布”同时出现的绝对次数;而置信度剔除了“啤酒”本身的频次影响,反映购买“啤酒”的行为对购买“尿布”行为的预测强度。同时具备一定的支持度计数和置信度的集合中的项被认为具备较强的关联性。
在弹幕数据中,我们将某个用户所发弹幕中提及的所有车型视为一个待挖掘的集合。我们选取了三款关注量最高的车型(领克01,WEY VV7,新本田CR-V),并使用Relim算法找到了这些新车的频繁项集(最低支持度计数定为5,最低置信度定为0.05)。对于某一款新车而言,如果存在较多的频繁项集,则意味着其他车的车迷也更多地关注这款车;这种普遍的关注,说明了这款车跨品牌、跨车型的吸引力,也会在一定程度上转化为更广泛的购买行为。
对于领克01而言,我们找到了21个频繁项集:
也就是说,图中除领克本身以外的21款车型的车迷都比较频繁地关注领克01。这意味着,领克01对众多的品牌、车系的车迷都有较强的吸引力,彰显出极强的活力。其中,同时关注WEY VV7和领克01的人数最多,支持度排到第一。另外,“领克01 WEY VV7 其他车型” 也成为一种范式,这意味着其他车型的关注者也较多地同时关注领克01和WEY VV7,体现了二者的高度竞争性。
下图展示了和领克01有较强关联的车型的支持度计数(横轴)和置信度(纵轴),点的大小代表了该款车关注人数的多寡:
WEY VV7对领克01的支持度计数达到180,置信度也达到14.4%。这意味着有180位发弹幕的车友同时关注WEY VV7和领克01,而这一数字占到WEY VV7总关注人数的14%以上,进一步说明了二者的竞争性。“WEY VV7 X”的范式具备超高的置信度(> 30%),体现了这一范式对领克01的关注者的高预测性。其他的车型的支持度计数大多介于5到30之间,置信度大多介于0.05之0.2之间。
对于WEY VV7,我们找到了19个频繁项集:
虽然稍逊于领克01,跟WEY VV7有较高关联的车型也呈现出百花齐放的特点,体现了其跨品牌、跨车型的强大吸引力。WEY VV7和领克01互为镜像:领克01也成为对WEY VV7支持度最高的车型;“WEY VV7 领克01 其他车型” 的范式对WEY VV7也成立。
有关车型的支持度、置信度分布如下:
领克01对WEY VV7的支持度计数也为180,置信度达到16.8%。除海马V70外,对WEY VV7置信度最高的也是“领克01 X”的项集,印证了二者的高度重合性和竞争性。
领克01和WEY VV7不仅拥有相似数目的频繁项集(21 vs. 19),和这两款车关联度较高的车型重合度也很高(12款车型重合),说明了这两款车的潜在消费者十分类似。而且两款车互相之间的支持度和置信度也较高,说明了很多车友同时关注这两款车,购买时可能从中选择一款更中意的。
最后,第三款新车——新本田CR-V有18个频繁项集:
可以看到,在和新本田CR-V有强关联的车型中,丰田、本田、马自达等日系品牌占到6席,占比约三分之一。这说明了,新款本田CR-V最受日系车迷的关注,日系车友也更有希望成为新本田CR-V的消费者。从具体数值来看,支持度计数达到10以上、置信度达到0.1以上的强关联车型有丰田凯美瑞和丰田汉兰达两款,均为丰田品牌。从整体来看,新本田CR-V主要吸引日系车友,跨品牌和跨车型的活力逊于领克01和WEY VV7两款明星车。
总结
4月份的上海车展不仅吸引了大量的公众和媒体到现场参观,也吸引了数量更为庞大的线上观众通过直播、论坛讨论等方式参与到上海车展中。
对于本次车展,自媒体和直播的影响力巨大,观看直播的观众远远超过到现场参观的公众,在地域上的分布也更为广泛。从线上数据来看,网络观众对国产品牌的提及量约占到总提及量的一半,对SUV的关注热度超越了传统轿车。就具体的品牌和车型来看,哈弗和本田获得的关注度最高;在首发车型中,领克01、WEY VV7和新本田CR-V位列前三甲。
在车展期间,车友们对于关注度最高的五款首发车型的评价都较为正面,“不错”、“便宜”、“安全”、“漂亮”等词成为共用的频繁词。从不同车型之间的关联性上来看,WEY VV7和领克01之间体现出极高的相互竞争性,而第三名新本田CR-V则最受日系车迷偏爱。
知乎专栏:数据冰山
微信公众号:数据冰山
求报道、意见反馈、调戏 小秘书 “佳佳” 请加微信:
微信扫描下面二维码,关注 加速会微信公号,成长快人一步!
如果你在创业, 想认识更多的创始人,彼此学习、资源共享 ,请扫描下面二维码加入 : 创始人通讯社群 !
如果你在职场,想 认识更多媒体圈朋友(编辑/记者、市场、公关、媒介、品牌) 请扫描下面二维码加入: 媒体圈通讯社群 !