如何开始你的语音交互设计:场景篇
上一篇主要是针对用户画像的创建,画像和以往的UX体验设计或其他领域的画像基本类似,那么接下我们的文档如何撰写,对话逻辑从哪里开始呢?这个问题就涉及到场景问题,而语音交互的场景模式无法完全复制使用户体验地图和场景的接触点,因为它出现的太分散,而且场景太多。
那么下面我针对我公司的项目,做一个简单的分析,为了降低用户场景的难度,我使用在室内的固定场景,而不是类似siri这样的多维度场景,这样有利于各位快速上手进行分析和撰写文档。
STEP 1,确定对话场景和关系,并给它赋予一个语气:
1,语句有引导性、机智,能够推动对话进行,并鼓励用户探索式对话。
2,语气乐观,愉悦,鼓舞人心,有潮流词,不会很正式,会采用简单的语言。
3,话能够吸引不同的用户年龄层与群体。
STEP 2,确定在家中的固定场景,并设定不同环境的场景对话分类:
经过两周的头脑风暴和实际样板间的接触点采集,我们锁定了几个基于家中固定场景对话,并为设备做时间周期为24h,充电状态下实时监听语音对话的后台模式,同时我为家中的人的角色也做了分类,而此分类采用家庭成员最大模式,也就是三代同堂的5口之家,这样涉及的老人,孩子和父母三个纬度的画像和使用场景基本都可以覆盖到,针对每个人年龄的对话需求也可以灵活回答。下面就是罗列出来的一些基本场景列表,就作为本篇V1.0的的场景对话文档的开启。
1,控制家中智能设备的语音指令
2,出门问问的语音互动:
3,娱乐互动对话
4,唤起内部应用
5,语音备忘录
6,语音@家庭成员提醒
7,欢迎模式
8,日常指令
9,消息朗读指令
10,安防开启和关闭
11,通话唤起
12,日常提醒
STEP 3,对话文档撰写:
其实很多人问我,语音交互产品文档怎么写,网上很多也没有实际案例和所谓的模版可以复用,其实在对话撰写的时候,就像写台本是一样的,这个并不难,但是还是需要考虑到所有对话的上下文所出现的临时情况,所有上一篇已经提到不管怎么设计,最后还是要到实际场景中进行测试,也就是大声朗读它。(见上一篇)“大声的去朗读你所写的对话,因为有时候第一次写这样的对话脚本会把语音写的很正式,不够生活化,所以要做到像平时随意的对话一样,需要大声去朗读,并反复测试,去掉那些正式的关键词,换掉更接地气的口语。”
但是经过前辈们的反复测试,在demo环境下,基本是一下几个对话路径即可:
1,愉悦对话路径
2,连续2-N次愉悦对话路径
3,试探性的猜测对话路径
4,超出时间对话修复路径
STEP 4,基于以上,我们开始撰写语音交互文档啦:
一定要记得,写此类文档的时候,开始下笔不要犹豫,可以想到哪写到哪,因为不管怎么思维缜密的人,在写此类文档后,后面测试和朗读的时候也一定会有遗漏的对话。
但是基于对后面语音转化的技术问题,我在文档里需要注意的是加入关键词的标注即可,这样在对接科大讯飞或者腾讯云的时候,就变得轻松一些了(关于语音的对接和接口问题,我准备在写一个技术篇专门针对软硬件的问题进行分析)。
下面我们举几个简单的例子,由于这个设备是固定在鞋柜上的,所以业主每次出门前,在换鞋的那几分钟都会经过它,所以这个场景对于我们的产品极为重要,那么如何提升用户和它的互动性,我们为用户提供了出门问问的关键场景对话,比如天气,路况,限行,随身带的物品和备忘录等。(见下图的硬件设备)。
1,唤醒设备:
I: “ h i,小智~”。
W: “在呢~”
关键词:小智(在交互语音对话文档撰写中,关键词和备注是很重要)
备注:以下“I”代表我(用户),“W”代表AI Persona(智能机器人)
2,愉悦对话路径:
需要撰写用户经常使用的几种问题形式,此类在实际环境中其实是一个反复监听和训练的过程
I: ”今天天气怎么样?“or
”今天 天气 如何?“or
”告诉我一下 天气 情况?or
“播放一下 天气 预报“or
“今天 冷不冷 ”or
“今天 多少度 ?”or
“今天 降温 了吗?“or
“......"
关键词:天气,冷不冷/热不热,降温/升温
W: “今天室外气温32度,夜间有小雨,出门记得带伞哦”
备注:固定模式回答,一句话里分为前后两段,气温,小雨等是抓取的第三方天气数据,由讯飞转化成语音即可,出门记得带伞是UX设计的用语,可以由5-10种模式根据前面的数据随机匹配,语气就靠设计师来组织了~。
3,其他单次愉悦对话路径案例
I: “小智,打开我的备忘录”
W: “好的,今天您的安排日程如下~”(同时屏幕上配UI设计图:pad端显示备忘录信息,用户可以在出门前查看)。
备注:如果W的回答是“好的,今天您的安排日程如下~,是否为你设个闹钟提醒或发到你手机上呢?”那么愉悦对话路径就变成了2-N次愉悦对话路径,这个对目前的AI技术相对来说实现起来有点难度,因为AI需要知道下一次用户的反馈信息,再进行二次判断,而二次判断的结果有时候并无法做到固定答案,所以暂时建议各位尽量减少2-N次的对话场景设计。
I: “小智,晚上5点提醒我妈妈吃药”
W: “好的,已加入家庭共享备忘录中,到时见我会提醒她的,放心”
备注:AI自动设别的为用户问的关键词,而固定回答模式可以由UX设计师撰写回答模式和语气,遇到问题随机回答即可,而注意的是回答的用词尽量要口语化,不要很官腔。
4,试探性的猜测对话路径+连续2-N次愉悦对话路径
I: “小智,今天早上 交通 如何?“or
“现在出门, 几点到 公司“?or
“帮我看下 路 况”
关键词:交通,几点到,路况
W: “你经常上班的路上有点堵哦~,大概40分钟可以到公司?你今天是否要去公司呢?”(后面尾句为试探性反问,如果用户继续回答,AI将出现下一次对话路径。)
备注:由于这个硬件设备并不是专业做地图软件app的,所以我吗抓取了用户经常使用的地图和常去地点的路况,这项内容并不能做完完全智能化,但是可以满足用户周一到周五的固定路线的出门前预告。
5,超出时间对话修复路径
I: “hi,小智~”。
W: “在呢~”
I: “HI~......"
W: loding......
W: “ 你刚刚说什么?”
I: “晚上你觉得我吃什么好呢?“
W: ”随便吃点什么吧~“
I: “你今天在干嘛?“
W: “ 随便干点什么吧~“
备注:这类句子就不多举了,主要是考虑用户无聊的时候把AI当对话伴侣,那么会出现很多无法解答的问题和不在库内的问题,我当时采取了使用100组固定模版随机组合的回答模式,另外还有问题采用了回避模式,比如刚刚没有听清,你刚刚说什么,我有点不太明白等等回答模式来应对。毕竟现在的AI语音技术在实际落地应用的时候受到很多限制,还没有那么理想的智能化。
STEP 5,总结~
在整个语音交互的设计过程中,目前可以理想做到的其实是基于几种常见的环境模式下的常用操作,比如智能家居的控制,开门,闹钟设定,备忘录提醒,打电话,音乐识别等事先预设好的语音命令。如果想像科幻片里那样,把它当成一个真的人来对待,需要AI大量的练习和监听,这也是为什么国内外大厂都在做这块硬件产品(比如智能音响),而且低价卖给用户,其实都是想在实际场景下对用户的对话进行监听和深度分析练习,有了庞大的数据库后,未来在复杂的对话环境中才能分辨出哪些人和人之间的对话,哪些是人和AI的对话,从而做到真的智能应对。
Smith