【新媒体语义分析】关于“洪荒少女事件”的大数据舆情分析
这次,苏格兰折耳喵想介绍一种关于跟新媒体运营相关的大数据分析工具---舆情分析/语义分析,它是一种对信息内容作客观系统的定量分析的专门方法,其目的是弄清或测验信息中本质性的事实和趋势,提示信息所含有的隐性情报内容,以及对事件的发展做情报预测。
一般来说,做好舆情分析会有如下几点好处:
- 厘清事件发展的概况与脉络,了解事件在当前处在怎样发展阶段(一般某个事件的发展过程会经历8个阶段,即引发期、酝酿期、发生期、发展期、高潮期、处理期、平息期和反馈期)
- 知晓媒体和公众对于某个事件、品牌的主要观点与情绪是什么
- 民众处于认知、态度表达还是处于行动阶段
- 对热门事件进行即时追踪,了解事件的意见领袖和主流观点,为文案撰写指引方向
下面,小喵将以里约奥运会期间红遍大江南北、名扬海内外的傅园慧以及她的“洪荒之力”为例,来聊聊这种基于内容的大数据分析对我们的内容/新媒体运营有什么启发意义。
概况
关键词:”傅园慧“+”洪荒之力“
时间段:2016/08/05,18:56~2016/08/23,18:56
数据采集量:互联网上采集到的1940176条信息进行了深入地分析。舆论最高峰出现在2016年08月08日,当天共有637835篇相关舆论;
初始时间点:由于小喵选取的初始时间早于该事件的确切发生时间,即2016年08月05日,19时25分发布在金融界标题为:“机器人奥运”洪荒之力将爆发 WRC20...这条当然是跟本事件无关的噪声信息,需要我们用常识来过滤掉。
数据来源:本文数据撷取于全网,主要来源于新浪微博、微信、新浪网、搜狐媒体平台、新浪博客等几大站点。其中,后续舆论主要集中在境内(中华人民共和国本土范围内),微博类型的相关舆论最多。
总体来说,整个事件发展趋势较为突出,接下来,小喵将从如下几个方面对本事件进行舆情分析:
一、事件走势
“事件走势”是指,随着时间的发展,媒体及公众对于事件相关报道或评论,主要反映在内容数量和渠道上数量上的增减趋势,由此可以看到事件的关注度增减趋势及舆论风向变化情况。其中,某个话题的“相同文章数”可以间接反映出该话题的热度怎样。
由于小喵选取的时间是从8-5开始的,比事件发生早了近三周的时间,也会出现一些干扰信息,如第一条,需要进行识别和排除。
1.[8月5日 19点]“机器人奥运”洪荒之力将爆发 WRC2016 十月盛大开启[金融界](可能是事件源头,仅供参考)
相同文章数:33
2.[8月14日 13点]#洪荒之力女主播# 真棒!女子100米仰泳傅园慧铜牌![给力]】里约奥运会女子100米仰泳比赛,傅园慧并列第三夺得一枚铜牌!再次创造个人最好成绩!傅园慧接受采访时才知道自己获得了奖牌,笑称昨天把洪荒之力用完了。再次为表情包傅园慧点赞[威武][威武]![新浪微博]
相同文章数:18602
3.[8月18日 14点]【萌翻!中国游泳小将傅园慧晋级受访表情大亮】20岁游泳小将傅园慧顺利晋级女子100米仰泳决赛,赛后采访中她化身行走的表情包[哈哈]在得知自己的成绩是58秒95时,傅园慧直呼我已经用尽了洪荒之力,并做出了亮眼的表情。[新浪微博]
相同文章数:5242
4.[8月21日 8点]【高萌!#泳届谐星傅园慧# 动图来了![偷乐]】在里约奥运女子100仰半决赛中获得第三、成功晋级决赛的中国选手@傅园慧o_O ,贡献了一波表情包,戳动图感受洪荒之力↓↓这组图我攒了很久了,终于凑够了九宫格![doge][新浪微博]
相同文章数:6537
5.[8月22日 14点]如果把傅园慧的采访倒着放,哈哈哈感觉比原版更魔性了,来感受下这洪荒之力![哈哈] [新浪微博]
相同文章数:2454
6.[8月22日 17点]【女子100仰决赛傅园慧夺铜】#里约奥运会#女子100仰决赛中,霍斯祖第一58秒45,获得个人第二枚金牌!美国选手贝克尔银牌58秒75,加拿大的麦斯和傅园慧58秒76并列第三,傅园慧再度祭出洪荒之力,再次创造个人最好成绩![新浪微博]
相同文章数:11905
7.[8月23日 6点]记者:今天有没有保留实力 傅园慧:没有,我已经用了洪荒之力 记者:......... 记者:对明天有没有充满期望。。 傅园慧:没有,我已经很心满意足了 记者:...........[新浪微博]
相同文章数:37186
8.[8月23日 13点]哈哈哈哈傅园慧获得铜牌的采访笑死了: 傅园慧:“虽然我没有拿到奖牌[纠结]。。。” 记者:“你拿到了你拿到了,你是并列第三!” 傅园慧:“啊?啊?第三啊?并列第三啊?那我还是对自己很满意的![偷乐]” 恭喜洪荒之力[doge]![新浪微博]
相同文章数:6707
9.[8月23日 15点]【女子100仰半决赛赛后 傅园慧接受采访萌翻了[太开心]】#2016里约奥运#女子100仰半决赛中,中国选手傅园慧以58秒95的好成绩获第三,晋级决赛!赛后第一时间接受采访,听说自己的成绩,姑娘大呼“我有这么快?!我很满意!已经用了洪荒之力了!”采访精彩程度不亚于比赛~戳视频,3分32直达采访:[新浪微博]
相同文章数:59602
10.[8月23日 15点]傅园慧手机在奥运村被偷,你的洪荒之力呢。。。还能看到傅爷直播吗?这是之前傅园慧张继科直播对比 ,没有对比就没有伤害哈哈哈哈哈哈~[新浪微博]
相同文章数:9943
11.[8月23日 16点]【傅园慧:洪荒之力用完了】@傅园慧o_O 继续金句频出,不剧透,看视频~#里约奥运会# [新浪微博]
相同文章数:94674
除开第一条外,从余下的10条主流信息可以看出,随着傅园慧在奥运会中的表现越来越抢眼,事件的报道“宽度”(话题范围)和“深度”(话题的集中程度)呈现增长趋势,而且相同文章总量越来越大,出现话题“井喷”现象。
二、网站统计
”网站统计“指在给定的时间段内,全部来源信息的分时统计情况。同时,也可以看到报道该事件的渠道主要有哪些,以及随着时间的变化,各个渠道报道量的增减趋势。
由上图可以看到,8-8这天媒体对于“傅园慧”+“洪荒之力”的报道量最大,也就是傅园慧说出响彻云霄的“洪荒之力”的当天,而且在“傅爷”8-9号夺得里约奥运会女子100米仰泳决赛牌之后,相关报道量也维持在一个相当高的量上,这说明本事件的报道具有即时性。
同时,我们还可以看出,该事件的生命周期很短,具有“短“、”平“、”快”的特点。
最后,在信息渠道方面,微博的信息量几乎和全部报道量持平,这也说明微博这样的媒体传播时效性极强,而且裂变的速度惊人。
三、数据类型
“数据类型”下辖四类指标,即“情感分析”、“境内外分布”、“媒体来源占比”、“媒体活跃度分析”和“地域分布图”。
其中,“情感分析”又称意见挖掘(opinion mining),它的目的是通过分析带有主观情感或者褒贬倾向的主观性文本,挖掘其中的观点或评价信息,以其更加直观的方式或者形式呈现给大家。
“境内外分析”则表明该事件的舆论信息在本土(中华人民共和国境内)和海外的信息分布比例。
“媒体来源占比”则是各种类型的渠道、栏目报道该事件的数量情况。
“媒体活跃度分析”则表明该事件在哪个渠道报道得最活跃,也就是时间上和数量上的综合活跃度。
“地域分布图”则表明哪个区域的媒体报道量和网民评论量较多,间接反映哪个区域的民众对该事件最为关注。
情感分析
“情感分析”部分显示,傅爷的报道绝大部分是正面的,极小的负面舆情,这当然在情理之中---这股来自里约奥运的“泥石流”给大家带来了无尽的欢乐,同时也刷新了海外媒体对中国奥运健儿的认知,其意义甚至超过金牌本身。
境内外分布
“境内外分布”部分显示,该事件的报道量绝大部分来自于境内。
媒体来源占比
“媒体来源占比”部分显示,该事件的报道主要来源于微博、新闻、网站和微信等渠道/栏目,而这些渠道/栏目都具有即时性的特征。
媒体活跃度
很显然,微博在这类事件的传播上具有极强的“话语权”。
地域分布图
根据下图所示,广州、山东、北京和江苏等4个省市区对于该事件的媒体报道量和网民评论量最大,表明这些省市区的对“傅爷”事件的关注度最高。
四、关键词云
“关键词云”部分较为直观的反映了”傅园慧“+”洪荒之力“所代表的事件中,出现频率最高的一些关键词,“傅爷”的大名和她那句“洪荒之力”自不必说。另外,“里约”、“奥运会”、“游泳”、“表情”等与该事件有关的关键词出现的频次较高。说明大量的媒体在报道该事件时,用了这些词汇。
五、热门信息
“热门信息”显示出各大媒体/渠道关于该事件的报道中最引人注意的一些话题和舆论,这些信息及其发布者在该事件中充当着“舆论领袖”的角色。
从下面的信息可以看出,关于此次事件的、受网民认可和支持的舆论绝大部分来自于微博这个新媒体渠道,而且明星的发言更引人注目。
六、热点网民/意见领袖
“热点网民”表明各个媒体渠道的“意见领袖”是哪些,他们的意见直接影响了公众对本事件的看法。
热点网民统计中,最活跃的网民排行分别是“财刑咏纯米”、“小莹就爱待在冷宫里”、“遇见_是必须的迷恋”,如要继续跟进“傅爷事件”,这些“意见领袖”则可作为事件舆论的重点监控对象。其中“财刑咏纯米发布文章”1024篇,“小莹就爱待在冷宫里”发布文章688篇,“遇见_是必须的迷恋”发布文章582篇,根据发帖量的多寡也可以预见其内容生产能力,预估这些“意见领袖”对该事件的影响力大小。
七、传播途径
“传播途径”反映出该事件非微博信息的传播轨迹图,“全景”的展现了该事件除微博渠道外,是如何从一个渠道传播到另一个渠道,再到其他渠道,一步步的“开枝散叶”。
除去干扰信息([8月5日 19点]“机器人奥运”洪荒之力将爆发 WRC2016 十月盛大开启[金融界]),从上图可看出,该事件的首篇相关报道于8月14日 13点在新浪微博上发布,报道标题为:
#洪荒之力女主播# 真棒!女子100米仰泳傅园慧铜牌![给力]
而后,更多相关报道出现,并通过中国新闻网进行传播,经过这些网的传播,将事件扩散化,可将微博作为舆论监控的重点媒体渠道。
八、相关词
“相关词”反映了跟本事件相关联的一些关键词,它们跟本事件有着类似的产生背景,如“里约奥运”、“音乐”、“女排”等。
如果在做内容产出时,想避开太过热门的话题,又不想使话题偏离该事件太远,我们就可以根据相关词来扩展周边话题,从热门话题中“突出重围”。
九、观点分析
新闻观点分析
“新闻观点分析”显示了各大媒体对本事件的主流观点,以及该观点对于网民的影响力大小。其中,第一条“奥运网红身价涨多少?傅园慧'主播'身价至少涨20倍”,该观点在排名前八的主流观点中占据26%的相对影响力,在“量”上则是2709的“影响力”数值。
这些媒体观点主要表现在如下几个方面:
奥运网红身价涨多少? 傅园慧“主播”身价至少涨20陪(26%)
华龙网:奥运网红身价涨多少? 傅园慧“主播”身价至少涨20陪。
福建之窗:奥运网红们身价涨多少?傅园慧“主播”至少涨20倍。
腾讯大豫网:奥运网红傅爷身价翻五倍 比肩孙杨宁泽涛。
傅园慧:快被霍顿气死 拥抱孙杨感觉很奇妙(21%)
黄山在线:傅园慧:快被霍顿气死 拥抱孙杨感觉很奇妙。
长城网:傅园慧谈被孙杨拥抱:直接摸到肉的感觉有点奇妙。
新浪网:傅园慧:差点被霍顿给气死 拥抱孙杨感觉很奇妙。
爆发洪荒之力!神模仿.傅园慧(15%)
东风悦达起亚大理嘉源专营店:爆发洪荒之力!神模仿.傅园慧,笑到肚痛!
尚美陶陶瓷:贾乃亮模仿傅园慧爆红表情包 爆发洪荒之力。
山西科技报:演技!贾乃亮神模仿傅园慧 爆发洪荒之力。
享受"洪荒之力"是奥运的新审美(11%)
绿网:新华网评:像“洪荒少女”一样享受奥运 网评热议。
btime.com:享受"洪荒之力"是奥运的新审美。
海东时报:享受一个“不完美”的奥运。
论坛观点分析
与微博、微信这类渠道即时性强相比,论坛对信息的翻阅就显得滞后,在论坛这样即时性不强的网民聚集区,跟本事件无关的干扰舆论占据多数,所以,今后对于这样病毒性传播力较强且具有强即时性的话题和事件,可以直接绕开论坛这个传播渠道。
这些 网友观点主要表现在如下几个方面:
猜涨跌:二元期权,你猜不到的洪荒之力(30%)
爱你的宝:猜涨跌:二元期权,你猜不到的洪荒之力。
爱你的宝:猜涨跌:二元期权,你猜不到的洪荒之力。
城济论坛:猜涨跌:二元期权,你猜不到的洪荒之力。
我们中国电影《你在哪》爆发洪荒之力闯入威尼斯(24%)
何凯羹:我们中国电影《你在哪》爆发洪荒之力闯入威尼斯。
小萧子:《你在哪》发新预告,爆发洪荒之力闯入威尼斯。
厦门小鱼网:[分享] 我们中国电影《你在哪》爆发洪荒之力闯入威尼斯。
理财千千万,互联网金融助你开启洪荒之力(14%)
huangfei:理财千千万,互联网金融助你开启洪荒之力。
得融在线1:理财千千万 互联网金融助你开启洪荒之力。
舍得575:理财千千万 互联网金融助你开启洪荒之力。
奥运赛场上的中国如何更可爱(8%)
Envlsage:奥运赛场上的中国如何更可爱。
丁香姑娘:传承“奥运魂”共筑“中国梦”。
心在曹营:薛涌:为什么说这届奥运中国赢了美国?
微博观点分析
“微博观点分析”则重点以微博为分析对象,罗列出微博上对于“傅爷”事件的主流观点有哪些。
十、舆情总结
综上所述,在傅园慧事件中,以正面舆论为主,广东、山东和北京等地网民和媒体对此事件更为关注。其中,社会舆论以”奥运网红身价涨多少? 傅园慧'主播'身价至少涨20倍"和”转发微博 【原微博】 【傅园慧:洪荒之力用完了】@傅园慧“为主,反映出该事件具有娱乐性和商业性的双重特征,我们在做内容产出时,可以把这2个话题所反映的观点作为风向标。
最后,小喵想说的是,该工具适合用来对短时间爆发的事件进行分析,通过上述语义分析和传播渠道分析,我们可以搞清楚类似的事件今后应该从哪些渠道进行“蹲守”和“追踪”。
此外,因为舆论监测是一个动态的过程,我们还需要时时注意舆论的走向和所处的生命周期节点,适时关注主要KOL的言论,第一时间找到目标受众所关注的信息"G"点,以此作指导,生产出阅读量高、传播力强的内容来。
作者:苏格兰折耳喵,微信公众号:运营喵是怎样炼成的,个人微信:g18818233178),此喵从事运营不到2年,擅长数据分析和可视化表达,最近寻坑中,欢迎有运营相关坑位者可以勾搭我。
【相关推荐 】
李根同学|透过a标签的操作手法,来看互联网运营人该如何独立思考!
柏拉图APP一夜吸粉百万的背后
你是做市场的?告诉你,你要涨薪了!
优云老王干货总结:数据带来的奇妙世界(四)
App吸粉方式有哪些?附带案例