斯图飞腾Stratifyd:大数据+NCAA=?球迷情绪预测体育赛事结果
每年三月,有一项赛事将吸引全世界篮球迷的眼光,那就是全国大学篮球联赛(NCAA)的“疯狂三月”。
“疯狂三月”指的是NCAA男子甲组(Division 1)篮球锦标赛,赛程从3月中旬持续到4月初。“疯狂三月”虽然只是大学级别的比赛,反响却非同一般,从亿万富豪到普通球迷都会为这项赛事如痴如醉。
作为如此大型的赛事,冠军得主将花落谁家自然是备受关注的事情,不少机构也纷纷加入预测的队列,给紧张的赛事添加了几分神秘色彩。Stratifyd也决定来凑凑热闹,用敏捷AI驱动的体验分析平台对赛事结果做一些预测。
这篇文章我们将重点关注与16支决赛队伍有关的社交媒体帖文的情感分析。 通过分析比赛前几天Twitter上的帖子,我们想知道能否通过分析社交媒体上球迷关于每支球队的情绪来预测比赛结果。
情感分析使用自然语言处理(NLP)技术对文本进行情感赋值 。尽管人类擅长理解语言背后的情感,但人工智能的进步使机器能够比人更快地分析大量数据。它可以分析任何形式的客户反馈内容,包括 社交媒体贴文、呼叫中心聊天记录、电子邮件等 。(点此了解更多有关情感分析的内容)
我们假定,球迷围绕每支球队的整体对话越积极,他们就越有可能认为这支球队会赢。你可以理解成是一种众包预测,即集合众人的意见去预测可能的结果,就比如我通过观察奥罗尔罗伯茨大学(Oral Roberts University)的赛季表现就能“料到”他们将赢得第一轮比赛(当然,关于他们接下来的赛事走向我没能成功预测)。
那么,通过球迷情绪能100%准确预测赛事结果吗?答案是否定的。尽管球迷们对他们喜爱球队的发展走势有了大致预判,Stratifyd情感分析模型也在16强的决战赛果预测中实现了5/8(63%)的命中率(见下图),这仍是历史上最难以预测的比赛。
01
No. 6 USC vs. No. 7 Oregon
基于球迷情绪预测获胜方:USC
实际获胜方:USC
Loyola Chicago和Oregon State的球迷情感值对比
02
No. 12 Oregon State 65 vs. No. 8 Loyola Chicago
基于球迷情绪预测获胜方:Oregon State
实际获胜方:Oregon State
Baylor 和 Villanova的球迷情感值对比
03
No. 1 Baylor vs. No. 5 Villanova
基于球迷情绪预测获胜方:Baylor
实际获胜方:Baylor
Arkansas和Oral Roberts的球迷情感值对比
04
No. 3 Arkansas vs. No. 15 Oral Roberts
基于球迷情绪预测获胜方:Arkansas
实际获胜方:Arkansas
Houston 和 Syracuse的球迷情感值对比
05
No. 2 Houston vs. No. 11 Syracuse
基于球迷情绪预测获胜方:Houston
实际获胜方:Houston
Gonzaga和Creighton的球迷情感值对比
06
No. 1 Gonzaga vs. No. 5 Creighton
基于球迷情绪预测获胜方:Creighton
实际获胜方:Gonzaga
Michigan和Florida State的球迷情感值对比
07
No.1 Michigan 76 vs. No.4 Florida State
基于球迷情绪预测获胜方:Florida State
实际获胜方:Michigan
Gonzaga和Creighton的球迷情感值对比
08
No. 11 UCLA 88 vs. No. 2 Alabama
基于球迷情绪预测获胜方:Alabama
实际获胜方:UCLA
由于这次分析主要依赖的是球迷的情绪和直觉,这些数据还不足以预测球队未来的发展走向,但是有些数据可以帮助我们预测可能的结果。关注Stratifyd微信公众号,下篇文章我们继续探讨。
情感分析是挖掘消费者认知和观点的绝佳方式,通过把消费者情绪与热门话题进行关联,您可以发现传统调研或其他形式的反馈分析可能遗漏的许多关键洞察。
情感分析的应用领域有很多。它可以追踪消费者对产品、服务的观点态度和情感认知,自动标记不乐观的情感走势,帮助品牌及时优化社交媒体的口碑传播策略;它可以分析消费者对竞品的评价,挖掘竞争情报;它还可以发现新兴问题的情感趋势,帮助企业预测客户流失的可能性。
体验Stratifyd
Stratifyd提供敏捷AI驱动的体验数据分析平台,利用自然语言处理和理解技术,解码非结构化文本反馈数据中消费者表达的真实情感和意图,监测市场话题趋势,辅助企业高效决策。
如果您也有消费者洞察难题,想要寻求解决方案去探寻未知的业务洞察,Stratifyd绝对是您的不二选择。
END