Steam游戏平台的评价体系解析
编辑导语:于平台而言,评价体系的建立可以帮助用户从其他维度了解产品,帮助用户更加正确地做出决策,也能提升用户的使用体验。本篇文章里,作者便针对Steam游戏平台的评价体系做了功能上的拆解和产品观上的总结,一起来看一下吧。
产品经理当中有混游戏圈的小伙伴们或多或少都对Steam有所接触,无论是重度常用Steam的端游玩家,还或者是只有听说过Steam的纯手游玩家,而在使用Steam的过程中,又或多或少相信接触过Steam的游戏评价功能。
而游戏的评价功能,对于游戏商店来说又是非常重要的一环。那么今天,我们就来研究分析一下Steam这么多年发展出来的评价体系产品现状——文章将从基础功能的拆解介绍,和立体的产品观拆解切入。
一、Steam游戏评价体系的基础功能
经过较多年的发展,实际上Steam的评价功能已经相对成熟丰富,商店游戏页右上的一个总分,和下方的一个整体的评价展示区域,形成了Steam评价的基本部分。基础功能上我们通过三张截图示例和一张Xmind思维导图的功能梳理进行呈现。
这一块的结构实际上大部分游戏商店之间都比较相像,但是在细节之处又有各自的特色。
例如Steam的打分机制是二维制度,只有推荐和不推荐的打分办法,并没有像其他商店那样采取五星制的打分手段。同时在分数展现上,Steam也采用了以文案描述为主的方式,而不是x.x分这样的办法。
文案描述上,实际上也就是10个档位,根据推荐与不推荐的比例,分别是overwhelmingly positive / very positive / positive / mostly positive / mixed / mostly negative / negative / very negative / overwhelmingly negative。
另外特别值得一提的是,Steam在提供评价筛选器的同时,还给玩家十分硬核地提供了评价趋势分析的功能,十分用心。
图示1、Steam评价打分UI界面
图示2、Steam游戏单页的总评分和时段评分
图示3、Steam的评价列表
图示4、Steam评价基础功能结构梳理
虽然整体梳理了Steam的评价功能基础结构,但这对于深度理解产品是远远不足的,那么接下来就让我们更深入地研究一下Steam评价体系的产品观是什么样的。
二、Steam评价体系的产品观
Steam对于其评价系统一直寄予很大的重视,在不断的产品更迭中更是迭代数次其评价体系。其基本的产品发展指导原则可以总结为:做一个能够为客户“精准导购”的评价体系。进一步说明,就是希望评分评价体系能够帮助用户准确地做出游戏购买和下载的决策。
总结而言,Steam做这套评价系统,在其发展历史过程中,产品观上可以总结为如下四点:
1)总评分有准确的价值表达
- 面向B端的风险控制:剔除来自Steam Key的好评行为。
- 面向C端的风险控制:剔除风控识别的异常账号的评分价值、评价轰炸的评分有效性剔除。
2)精确且有价值的评价能在前排快速呈现:
- “赞”、“踩”功能便于计算价值和热度,供给算法进行排序。
- 欢乐功能用于引流价值偏颇的『抖机灵』式的热门评测。
3)游戏运营过程中的游戏质量的动态变化能够进行及时呈现
- 长期有效评价和最近30日评价分区域展现。
- 提示用户在固定周期后适当修改评价。
4)深度功能帮助用户深挖需要的评价
充足的筛选能力。
那么接下来,就让我们围绕上方的基本框架,展开讲讲Steam如何立体地发展其评价体系。
1. 总评分有准确的价值表达
1)面向B端的风险控制
① 剔除来自Steam Key的好评行为
之前一个颇为常见的扰乱到评分的行为,就是开发者会发送Steam Key来换取评价。这当中的情况又分两类:
- 用户通过Steam Key激活游戏进行游玩,游玩过程或者游玩结束后给出游戏评价。而这一批用户因为其本身的属性特殊,属于较为核心的游玩群体,对于开发者又有一定的粉丝属性,因而在评价过程中更倾向于给出积极的评价。
- 开发者在发送Steam Key的过程中,明确要求了希望用户能够给出好评,实际上进行了一场Steam Key与好评的对等交易。
而这两类情况,往往都会导致总分失去准确性。在以上方明确的基本产品原则上看,Steam Key来源的评价在Steam团队眼里有必要在分数算法中进行剔除,因而在其之前的产品公告中明确宣布了去除。
图示5、Steam Key输入界面
② 剔除风控识别的异常账号的评分价值
Steam官方在其博客中就提到过,除了可以通过Steam Key刷取好评外,其在平时的运营观察中也发现了一些有组织的用户刷好评的行为,其来源仍然是开发者使用有偿的付费刷好评服务。
相对于Steam Key刷好评的过程,直接的付费刷好评服务会更难追踪,因而也需要更强大的风控算法对用户的评价价值进行评估,被认定为水军的账号评价进行适当剔除总分计算。
图示6、Steam博客中提及的被刷现象
2)面向C端的风险控制
① 评价轰炸的评分有效性剔除
评价轰炸,Review Bombing,Steam同时也称之为Off-topic Review现象。第二个名称其实会更好理解一些,即“跑题评价”,评价聚焦的核心不再是游戏体验本身,而是与游戏弱关联的一些事项(例如政治、人事相关事件等等)的发生,给游戏带了一波差评,导致游戏分数快速失真。
如图示7所示,笔者采集了两个例子。一个是2018年2月,游戏深海迷航的公司员工被辞退的消息在Twitter发酵,导致当月一批集中的差评在Steam上齐刷刷地送给了游戏本体。另一个例子是2018年10月,游戏《古墓丽影:暗影》由于厂商在游戏发售后较短时间内,便给出了优惠促销措施,导致最早原价购买的一批玩家心里不平衡,旋即给游戏送上一批集中的差评轰炸。
这些差评并不围绕游戏本身的玩法、画面等角度展开进行比较客观的评价,而是基于一些外部因素,导致游戏分数的准确性降低。
图示7、评价轰炸会出现的数据大型波动
对待这种行为,Steam在产品价值观上,始终认为此类动作对于准确的评分展现没有帮助甚至更多的是负面帮助。实际上,Steam的产品价值观并非纯粹建立在较为主观逻辑判断上,在实际追踪了此类群体行为发生的过程后,Steam团队发现,分数在当时情况下的快速失真,最终会被“时间”慢慢修复,游戏的分数会回归到其本身游戏体验所展现出的价值。
那么这些外部事件的发生,更多的是在当时个把月的时间范围内,影响了新客的购买判断,做出可能的错误购买决策。
因而面向这种较为常见的玩家泄愤行为,Steam最终选择了建立Review Bombing解决机制。在系统检测到一定程度的Review Bombing之后,会将跑题评价从总分计算和时间段分数计算中剔除,让分数本身更多地去折射游戏本身的体验。
同时,Steam还为玩家们提供了是否剔除跑题评价的能力,又在这基础上提供了评价数据趋势分析功能,帮助玩家在有个性化需求的时候追踪评价的动态变化过程。
2. 精致、准确且有价值的评价能在前排快速展现
1)赞、踩功能便于计算价值和热度,供给算法进行排序。
实际上Steam在这里使用了一问一答的方式来构建“赞”“踩”功能,问句是“Was this review helpful”而回答Yes或者No来表达“赞”“踩”。
严格意义上来讲,意思是有区别的,评价并没有帮助到浏览者并不完全等同于“踩”的负面含义。但是这样的构建,已经足够为算法对于评价的排序进行数据支撑。
图示8、每张评价卡片的底部区域,都构建了“赞”“踩”功能
2)欢乐功能用于引流价值偏颇的『抖机灵』式的热门评测
Steam在社区比较常见的功能“赞”和“踩”右边,又制作了“欢乐”按钮,意欲何为?
表面上看,似乎是让浏览者的情绪表达专门制作了一个选项。但是深挖Steam之前的官方解释,会发现这是为一个常见的人类行为“抖机灵”制作了引流。
可以参见图示9,用Funny筛选出的评价,更多地是聚焦在发布一些有趣、令人捧腹一笑的短小式评论,这些评论在普通的“赞”“踩”体系之下,可以快速地获得点赞,甚至进而升顶到热评第一位,但这符合Steam对于评价体系的“精准导购”的定位吗?
答案显然是否定的。这甚至对于一些认认真真写评价,围绕游戏玩法等角度展开评论的用户而言,都是一种热情上的和评论方向上的打击。
所以这时候Steam团队采用的办法,就是利用增加“Funny”选项,让用户在感到评价很有笑点的同时,能够适当去点击Funny而非点赞,那么对于排序算法来说,也就可以更高效地避免对“抖机灵”的评价进行不适当的升序计算。
图示9、用Funny筛选出的评价,更多地是聚焦在发布一些有趣、令人捧腹一笑的短小式评论
3. 游戏运营过程中的游戏质量的动态变化能够进行及时呈现
1)长期有效评价和最近30日评价分区域展现
总评和长期热评无法动态展现游戏近期的调整和变化。实际上,在一款游戏的生命周期当中,会有相当数量的版本调整和运营动作,这些事项也可以在评分中适当出现。
那么最近时段的评价单拉一排出现,就会是一个比较合适的解决办法,如图10所示。
图示10、长期有效评价和最近30日评价分区域展现
2)提示用户在固定周期后适当修改评价
很多用户其实在没有完整体验过游戏之前,就会对游戏进行评价动作。TA可能是在游玩的半途当中,甚至并没有开始多长时间,那么此时的评价准确性可能仍然是不够充分的。
那么这些用户,一部分人最终会不断推进至游玩结束,此时当他们再做出对游戏的评价,是会比游玩前期做出的评价更为精准的,这时候Steam也会以提示的方式请求用户考虑是否需要修缮评价。
4. 深度功能帮助用户深挖需要的评价
充足的筛选能力
如图示11所示,无论是在游戏单页的底部评价浏览区域,或者是游戏的评价单页,Steam都给玩家提供了充足的筛选项,来帮助玩家在需要的时候对评价深挖浏览,选项包括“评价类型”、“购买类型”、“语言”、“日期范围”、“ 游玩时长”、“展示方式”。
实际上,即便调动了较多的产品逻辑来保障评价的显示排序尽可能地合理,Steam也无法完全保障评价排序是完美的,那么此时筛选器就可以发挥较好的辅助浏览的作用。甚至于当用户有更加个性化的评价浏览需求时(例如一定要看游玩时长>x小时的玩家评价),筛选器会发挥更大的效用。
图示11、Steam在评价相关区域给予了用户充足的筛选项
三、结语
本文第一部分是简单地将Steam的评价产品从单纯的表现层开始推到做了一份思维导图的功能梳理,但实际上我们知道做产品的过程中这类梳理仍然是不够的,因而会有了第二部分更加立体的产品观的介绍,方便大家理解Steam在发展其评价产品体系的过程中,对其用户群体是如何运筹的,只有在充分理解其立体的产品观及其背后的思考逻辑之后,才能理解第一部分的产品设计为何这样做(例如为什么会有“欢乐”功能等等)。
最后,希望本文的分析,能够帮助到在相关领域深耕的小伙伴,感谢阅读!
本文由 @菠萝饭 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。