语音 用户 电台 前沿:开头必须来一句,我相信语音一定是未来,我非常确认这篇 HMI 的语言探索以介绍语音交互内容为基础,结合我的实际工作项目经验,输出总结关于语音设计的内容,最后结合案例,在对话设计中会进行深度的探索,并提出个人的想法和思路,因为有的时候深度去思考觉得我们项目还可以有很多优化的点。进入我们今天的正题。在说语音交互之前,先给大家讲一下题外话,关于人机交互(Human Computer Interaction)简称 HCI,可能日后我想去攻读这个硕士学位,简单来说就是指人与计算机之间通过使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。语音助手最初的载体是手机 APP,通过与用户之间的对话方式,能够帮助用户来解决问题的,随着我们现在人工智能的研发技术不断发展,包括让机器学习,语音识别、图像识别、自然语言处理、智能搜索等一系列。语音交互运用的很普遍了,不仅仅只是智能手机,现在涉及到的领域是越来越多了,如智能家居、汽车、可穿戴设备、就连商场普遍也有机器人语音对话。HMI 语音介绍我这边就不打算讲语音的发展历史了,不然又是水了一大堆内容,我可是一个讲干货的小作家呢,如果我的小粉丝们需要的话,就私信我,我会在微信公众号更文。语言是传递信息重要方式,对于我们用户来说,语音交互也是学习成本相对较低、容易掌握的,语音交互设计简称为 VUI。新能源汽车不断的发展,智能车载系统也是我们最看重的。随着语音交互的的普及,语音识别开始走入人们生活,凭借其实用性和准确性得到了用户的认可,因此在发展的过程中摒弃了传统的、繁杂的手动操作,提高安全驾驶属性和更高效的处理问题的能力,但是,在现阶段的新能源汽车发展过程中还不能完全替换掉手动操作。现在为什么用户在驾驶车的过程中,还是不会常用到语音交互,首先提到的就是用户习惯,根据数据调查,在使用语音交互的人群中,年轻人占了主力军,其余年龄段的人由于常年驾驶都是通过硬按键来操控车内空调、电话、音乐、电台、内置导航。其实就算是苹果手机中的 siri 都很少用到, 在使用初期因为技术的不成熟,再加上冰冷的对话方式使得用户不对这个买单,像我现在生活中,用到的 siri 频率也会很少,最多就是定一个闹钟,app 实在找不到就会使用到,还有无聊的时候和他进行无聊的对话,嗯就这样子。国内做语音头部公司有我们熟悉的科大讯飞,还有和多家车企合作的思必驰、云知声,对内服务的百度,搜狗,腾讯,阿里这些大咖都有自己的语音技术。再讲一下语音的基础原理内容,这一块比较难懂一点,首先你要说出你需要解决的需求、要处理什么事情,通过车载系统设备收到指令的语音 自动语音识别 (ASR) 将指令转化为文本 自然语言处理 (NLP) 了解用户需要解决什么问题 通过Skill (普及一下知识:Skill 是一种程序的语言,有notepad++,UltraEdit等,好了不啰嗦了) 将处理好的结果处理成回复文本 最后再通过TTS 播报形式 形成回复音频 通过车载系统回复给用户解决结果,听起来是不是有点复杂了,我相信我是全网说的最细的了。如何去定义一个产品的语音的好坏?我觉得吧,能够让用户对于这个语音系统的满意度达到一个高标准,首先能够让系统能够听懂你所说的内容,并且给出相对应的解决方案,语音系统运用的简而易用即可,如何做到以上的要求,我会在下面对话设计中会着重讲解深挖的。车载语音交互(VUI)基本原则车载场景下的语音交互核心基本原则有三点:1. 首先是安全驾驶过程中,司机的眼睛、耳朵和手占据了大部分多任务操作,如果一些功能还需要通过眼睛和手来操作的话,会降低安全驾驶的系数,所以车载语音交互更有助于辅佐司机安全驾驶,减少注意力的分散。2. 其次是便利语音交互设计之初,一定要考虑便利、快捷,尽量的减少每一个任务的对话次数、快速响应、将对话流程简单化,从而打破 VUI 对于用户的一个心理障碍(便利这块内容我会在后面对话设计中着重讲解)。3. 最后是愉悦为什么要谈到愉悦,因为市场上最初的语音对话交谈,都是冷冰冰的,几乎没有情感可谈,像极了和机器人对话,并且有的时候无法处理任务就会说,超出能力范围,这是一个很不好的用户体验。现在市场上可以看到,导航软件也有语音包可以选择,这也是增加了情感化设计,这是其中的一个点。还有一个小点就是自然的对话交流,很流畅的完成用户提出的每一项任务,尽可能的规避对话中的错误,让整体的对话过程达到一个愉悦的感觉。用户语音的目的用户在语音交互的时候,绝大多数都是带有明确指示任务指令的,也有可能是闲聊状态。1. 任务状态下:任务式对话中,用户需要尽快的得到想要反馈和解决方案,并且快速的完成,此类任务的反馈要求还需要清晰、简单明了。2. 闲聊状态下:我们经常也会问 Siri 一些无聊的问题,比如:“siri 给我来一段 Rap” 通常这类的任务带有的目的性不是很强,但是对于趣味性要求会高。市场现状(VUI+GUI)语音是最舒服的交互形式,但是他不能完全取代 GUI,相互协作才是更佳的方案,所以现在市场上的车载系统大多数都是以语音(VUI)和图形用户界面(GUI)相组合的,也有少部分车加入其他交互方式譬如手势交互。语音与图形的交互是交叉处理,从而形成了多模,多模态在我第二篇文章也有讲到,第一次看我文章的同学们可以回顾一下,用户在对车载系统发送一个指令的同时,设备会有多种的反馈方式,首先你可以听到系统虚拟形象给你做出回答,其次你看到图形界面的变化,举一个例子,你说:“我要听周杰伦的七里香”系统就会处理讲页面跳转到音乐界面,并且播放周杰伦的七里香,如果声音小了,你可以说:“声音大一点”大家是不是发现一个问题呀?我在前面说系统首先会做出回答,然后界面才会发生变化,但是实际情况,系统语音形象没有做出任何多余的回答,而是直接听取到用户的需求,直接反馈出结果,播放了周杰伦的 #七里香#,这就是我准备在下面会重点讲到的“对话设计”在说对话设计之前,我们先了解一下 VUI 设计师,想必大家头一次听说,还有语音(VUI)设计师嘛,国内不太注重培养 VUI 设计师,大家可以去招聘平台搜索一下语音交互设计师,很少有公司专门针对这个职位去招聘的,就算有,也是招聘算法等研发岗的职位,VUI 设计师的工作任务一般都是公司的产品经理或者交互设计师代劳了,这会肯定就有产品经理或者交互设计师想出来吐槽了,哈哈哈语音交互方式给用户听和说两个动作,相信大家也有听过 72 法则,因此在听到的信息设计发面需要考量,因为用户听到一遍内容之后就消失了,除非这款车机语音系统,有再次复述上一段话的功能,不然在语音设计的时候,千万不要让用户产生的认知负荷,更不要挑战用户的短时间的记忆力,最强大脑除外,我们大多数人可不是什么最强大脑是不是。再次强调一下,就算拥有复述这个功能,也要注意设计的语音内容,该功能点只是加分项而已,不能打破底线,将语音设计的原则抛之脑后。几乎所有设计师都在用的72法则到底是什么?了解 72 法则,并应用到日常设计中可以准确的传递主体内容,并使用户对其产生一定的印象。阅读文章 > VUI & GUI 的优缺点再分析一下图形设计(GUI)和语音设计(VUI)之间的优缺点,那我们先从优点开始说起。(1)前面我们有提到 VUI 只需要听 and 说,而 GUI 则需要触控屏幕内容,在效率和安全方面没有 VUI 好,触控操作比语音操作要相对会慢,语音交互方式中驾驶者无需离开方向盘。(2)在对于整套车机系统而言,GUI 学习的成本远高于 VUI,因为 VUI 只要会交流即可,无须像 GUI 一样学习触控交互手势、在哪里点击等一系列问题。(3)还有一点,图形设计是一种已经预设好了操作路径和交互方式,页面之间存在这层级交互的基本关系,用户需要根据指定的操作进行,而 VUI 则突破了 GUI 的限制,交互更快捷了,举个例子:“导航去虹桥机场”,VUI 则一步到位,而 GUI 首先需要找到导航应用的入口,然后再点击搜索输入框,输入#虹桥机场,确认完毕之后,再点击导航,我的天呐我写的都很烦了,说真的还不如语音一步到位呢。说完优点后,我们在反思一下 VUI 还有哪些没有 GUI 做的好的点.(1)语音交互涉及到 3 块内容,语音识别,识别用户所说的内容,其次语言理解,这边会关乎到方言理解的问题,毕竟我国语言博大精深,难以参透哈哈哈,最后是语音的合成,这三块内容如果有一块出了问题,最后反馈的结果可能并不是用户想要的答案。而图形设计有这统一的执行操作指令,不会出现什么 bug 问题,如果有,那肯定就是这款车机在测试的时候测试人员遗漏的问题,可以投诉。(2)整套车载的 GUI 设计都会有一套严谨的操作逻辑,有明确的信息分布和页面的层级关系,但是 VUI 的功能不可见(除非你看那个使用手册,哈哈哈哈哈)所有的场景 VUI 都需要去探索,在引导性方面会弱很多,所以在买车的时候抓住销售员使劲的问哈,毕竟你花了一大笔钱来买车了,在试驾的过程中也要多去询问,就先点到这里了。(3)GUI 是可以全场景交互,不限制于任何场景,而 VUI 则会受到的场景因素较大,有较多场景中不适用语音交互,最直接的就是设置中的内容。(4)语音设计对于用户的一个记忆力是一个考验,如果一个很长的 TTS 反馈,用户不知道哪里才是自己所需要的信息,因此在做 VUI 设计的时候尽量简短高效的句子,而 GUI 信息都会呈现在页面中,所以这个点要相对优胜于 VUI 了。总结一下以自然交互为主的,声音,显然是最自然的交互形式,但不能完全取代图形 GUI,而是更好的协作,尽量减少界面的形式设计,加强情感化的交互形式体验,将智能化更好的融入到车载系统中去,让每一位用户能够更好,更便捷,更安全的驾驶着汽车,是我们全体设计师的初衷。嗯,感慨了一下。想用一个成语总结一下:相辅相成,就是这个意思语音设计需要考虑几个要点1. 一定要想好从哪里开始,到哪里结束我们首先假设一个场景,调节空调温度的语音设计,那 VUI 设计师需要将这个场景的对话要贯穿该流程中去,那接下去要考虑这段对话可能出现的任何状况,以及相对应的解决反馈内容,再第二点设计 VUI 语法中,我给大家演示一下空调全方案案例。2. 设计 VUI 语法语法就是用户输入给机器的指令,VUI 的设计师需要了解对话设计的意图,尽量要考虑用户可能表达的所有方式,将最常用的表达方式提取出来,作为指令的模版,当然越多越好,这样给用户体验带来的感受会更好,能够解决用户的问题概率也会提高,别到时候语音助手反馈:“已经超出我能力范畴 or 您换个说法试试”,我一听到这些就炸毛了,后面就不可能再去使用它了,因此 VUI 设计师一定要多考虑一下指令。语法我会在我工作实际案例有特别详细的讲解(在实际案例篇幅 – 使用语音场景分析里面),这个特别重要,大家要细细的品。3. 空调案列分享:用户一开始的输入指令可能有 “打开制冷模式”、“打开加热模式”这些都会有点官方定义的语法感觉会很正式。下面再延展一下用户轻松的说辞 “我有点热了帮我开一下空调”、“今天太冷了,车温度好低啊” 其实用户的说法有很多,但是空调的模式就这么几种,所以需要抓住关键词 #热、#冷、#高、#低 …,什么意思呢?因为这些关键词是起到决定性因素的内容,其他的修饰词语可能会千变万化,所以语音助手一旦检索到该词汇,就可以做出判断,到底是制冷、还是制热、还是通风等功能。先简单就介绍这一个,后面还有很多案列,大家好好看奥。4. 如何设计好回答用户的问题在语音基础介绍中也有提到过 TTS,他是语音交互中最主要的回答方式,就是将 VUI 设计者撰写好的对话设计脚本,通过 TTS 转化为语音去播报。回答能够给用户带来最直接的感受,回复是好是坏,会直接影响到这款语音产品的体验,想要设计好我想谈两个大方向,设计脚本尽量简洁明了,全局系统语言特点保持统一,后续有案列可以叙述讲解的。国内外语音设计差异点国内的语音设计和国外也会存在差异点的,首先是地方语言的差异,国内语言多达 80 种以上,汽车智能语音在方言这一块相对堪忧,能够支持的方言相对较少,这也成为了中文语音识别的一个难题。在设计语音之初我们就得定义好,需要支持哪些方言,比如粤语、河南话、四川话等,现在的车载版本微信可以支持 20 多种方言,但是整体的车机系统可能难以做到这一点,这块内容是需要攻克的一个壁垒,据我查看国外报道,关于方言解决方案,宝马、三星和松下三家公司与语音识别公司 Nuance 合作开发新智能辅助技术,这项技术使得汽车语音系统在处理特定的方言时,可以更加容易。还有一点就是中西方语言文化差异,那就举一个例子,单从一个社会礼仪就可以展现出两者之间的差距,国人路过遇见熟人总爱嘘寒问暖 “吃饭了吗?”、“到哪儿去”、“最近怎们样呀?”等,在我们看来,这是一种有礼貌的打招呼用语,但你要跟西方人这样打招呼 “Have you had your meal?”、“Where areyou going? ”,他们则会认为,你想请他吃饭,或者干涉其私事,会引起误解,而西方人见面通常打招呼 “Hello”、“How do you do! ”、“Nice day, isn’t it? ”实际案列讲解篇幅1. 语音唤醒设计车载语音唤醒分为免唤醒和需要唤醒,免唤醒的定义就是无需说出唤醒关键词或者其他任何操作,就直接可以进行与语音助手交谈并处理任务。如需要唤醒的话,触发动作可分为点击、按压、语音等,目前市场上主流的车机唤醒方式有三种:实体按钮,好处就是能够给到用户触觉上的反馈,用户感知性强虚拟按钮:此类的按钮一般都会在中控屏幕上面,唤醒的方式是点击语音唤醒:在驾驶场景中双手被占用,不能远距离的操作中控屏幕,最佳的交互操作方式就是语音唤醒语音助手形象在语音助手形象设计方面,会分为两种,一种是卡通化语音助手形象,而另外一种是抽象化语音助手,下面用实际案例展示一下,卡通形象我们就拿未来汽车的 NOMI,抽象化 Google 的 Android Auto 语音形象基于工业设计 2021 年 01 期的调查数据分析来看,卡通化的语音形象在亲和力上有很大的优势,能够被用户快速的接受,但是辨识度上可能存在同质化严重问题,所以在效果表现力上面有欠缺,也较难表达车企的品牌理念。抽象化的语音形象则通过造型的多变和动效丰富,从而在设计感和效果上相对突出,在传达性上也不满意,用户不容易知道当前语音是处在一个什么状态下,在亲和力上远也不如卡通化形象。使用语音场景分析(重点)关于车内可以延展很多应用的场景,要知道用户在驾驶过程中需要完成什么样的任务,接下来我们就围绕这几个核心的功能点 多媒体(娱乐)、车辆控制、导航、电话,顺带将每个模块语音基础话术指令带过一下外加TTS反馈,也是让初学者熟悉一下命令,这块内容很重要奥,都是我在实际项目工作中总结出来的,大家要上点心好好看,答应我好嘛1. 多媒体(音乐、电台)播放音乐、电台或者是播客这些都是一辆车最为常见语音交互的功能之一吧,开车的时候都会听一些音频类内容,对于这个功能播放、暂停和切换歌曲等功能外,电台快速选择,针对这些功能我们可以划分一些子功能对应的典型话术。音乐-话术播放音乐按歌手 我想听霉霉的歌、播放周杰伦的歌歌曲名称搜索 播放天外来物、来一首七里香歌手名称+歌曲名称组合精准定位(因为有很多翻唱的曲目) 播放周杰伦的七里香按照语种 我想听粤语歌、放一些英文歌按照曲风 来点爵士音乐、播放摇滚音乐根据音源播放语在线音乐 播放qq、网易云、酷我音乐等等(因为每一家车厂合作的音乐供应商不一样)蓝牙音乐 播放蓝牙音乐、跳转到蓝牙音乐、放蓝牙歌曲、切换到蓝牙音乐、我要听蓝牙音乐U 盘音乐 播放U盘音乐、听U盘音乐的歌、跳到U盘音乐音乐播放控制命令切换当前播放列表上一首歌 切到上一首、上一首歌切换当前播放列表下一首歌 放下一首音乐、切下一首换一首歌播放 换一首歌、换一个音乐、换个歌暂停歌曲 暂停音乐、音乐暂停、停止播放音乐、不想听歌了继续播放 继续播放音乐、播放音乐针对于音乐这个模块的基础语言先讲到这边了,因为在线音乐的功能相对比较多,所以后续我会对于 QQ 音乐、网易云、酷我音乐等在线音乐额外的语言控制命令再写一篇续集。电台-话术播放电台打开电台 打开/开启收音机、听广播、播放电台/收音机/广播/Radio按频率收听 调频、播放调频、收听调频、广播按频段+频率搜索收听 我想听FM、FM、收听/播放/我要听FM、收听AM按电台频道搜索收听 我想听音乐类电台、我要听上海电台、收听/广播按在线音源+音频类型搜索并播放 播放喜马拉雅的相声按艺术家+音频类别搜索并播放 我想听郭德纲的相声播放源喜马拉雅 收听/打开/我想听 喜马拉雅FM 打开/收听/我想听/播放/我要听 FMAM 打开/收听/我想听/播放/我要听 AM电台扫描扫描电台 扫描电台、搜索电台、重新搜台、搜寻电台、搜索频道、扫描频道电台轮播轮播电台 浏览电台、电台浏览、电台轮播、轮播电台、快速浏览电台播放控制命令上一个电台 上个频道、上一个台下一个电台 下一个台、切到下一个台换台 换一个台暂停电台 暂停电台播放收藏/订阅 节目 收藏、收藏这个、添加收藏、加入收藏取消 收藏/订阅 节目 取消收藏、收藏取消车辆控制-话术基本功能包括车内空调温度调节、控制车窗开关、后视镜角度的调节,还可以切换驾驶模式、变换档位等等。空调控制空调控制 ON/OFF 打开空调、关闭空调空调 Auto 打开自动空调、自动空调开启空调打开+模式 太冷了、好热啊(检索到关键词,制冷/热进行切换模式)空调风量增减 风量大/小一点、风大/小一点设置风量级别 风量设设为2级、风量调成2级、风量最大/小空调温度增减 温度高/低一点、温度调高/低一档设置温度级别 温度调到xx度、温度设置xx度、温度调到最高/最低温度(空调温度调整到对应指)空调吹风模式 吹脸/脚、吹脸吹脚、吹脚前除霜、前除霜(前除霜:处理前挡风玻璃的)后窗除霜 打开后除霜/雾、打开后窗加热、后挡风玻璃除霜/雾车窗开启/关闭车窗 开/开启/打开/关/关闭 车窗(未指定某一个窗户,打开/关闭所有车窗户)指定开启/关闭车窗 开/开启/打开/关/关闭 – 左前/右前/左后右后窗 、 打开/关闭主驾旁边车窗、打开/关闭前排窗、打开/关闭后排窗、打开/关闭全部窗户车窗开启/关闭到具体数值 车窗开/关一半(1/2)(车窗调节范围0-100%,根据不同车厂设定值为准)情景模式前文中有提到 TTS 反馈,那我就在车辆控制中情景模式详细举例子给大家讲解一哈。清凉模式 打开/开启/关闭 清凉模式 TTS反馈 清凉模式已打开/关闭、清凉模式已处于打开状态温暖模式 打开/开启/关闭 温暖模式 TTS反馈 温暖模式已打开/关闭雨雪模式 打开/开启/关闭 雨雪模式 TTS反馈 雨雪模式已打开/关闭、即将关闭车窗,请注意安全抽烟模式 打开/开启/关闭 抽烟模式、我想抽烟 TTS反馈 抽烟模式已打开/关闭导航-话术导航是我们最常用的功能之一,对于用户而言输入地址是一件头疼的事情,所以在导航去目的地的时候,直接语音输入后,匹配所需要导航的目的地,让语音助手帮你直接导航,还可以询问语言助手到达目的地时间和距离播报,有的车机导航系统还可以支持语音缩放地图大小,省得两只手指在触控屏幕进行放大缩小操作手势,在导航中的使用语音主要的目的就是便捷与高效。导航中的执行逻辑我这边就不做过多叙述,因为相对要更专业点,后续有机会我再深挖讲解。导航公司 我要去公司、导航到公司、去公司、上班了回家 我要回家、导航回家、回家了注:如果没有设置公司/家的地址 需要进入设置公司/家的具体地址流程,设置完毕之后,方可语言导航去公司/家附近加油站 导航到附近/周围/周边加油站、帮我找个最近的加油站当前位置导航到模糊的POI(会产生多个结果) 导航到火车站(拿上海举例子:上海有虹桥火车站、上海火车站、上海南站、松江站、上海西站,因此产生了多个结果后,语音助手还会继续问到你需要导航到具体那个火车站,如果时间超过定义时间将默认为第一个)当前位置导航到POI简称 导航到人广(人民广场,要不要和我一起去吃炸鸡 哈哈哈)、带我去交大(交通大学)增加途径点附近其他 导航附近三甲医院搜索指定位置+指定类型 POI 帮我找一下南京西路的日式餐厅搜索指定距离+指定类型 POI 两公里以内的停车场、一公里中式快餐店搜索指定位置+指定品牌 POI 南京西路的古驰店导航距离/时间的播报查询途径点的距离播报 距离南京西路还有多远、距离下一个途径点距离还有多少查询途径点到达耗时播报 到南京西路还需要多久、距离下一个途径点还要多长时间电话-话术在驾驶过程如果需要拨打电话,是一件不太容易的事情,而且是极其危险的,所以需要结合语音进行来辅助,接听/挂断不管是屏幕触控还是方向盘的硬按键都可以直接操作,体验还不错,对于不习惯语音的的人来说该功能点可以替代,但总体来说,语音接通/挂断会优于屏幕触控,硬按键对于长期使用来说可能会有优过语音,对于用户来说,在安全驾驶前提下,哪种使用方式习惯就用哪种。拨打电话联系人姓名 打电话给老妈、呼叫老爸、联系哥哥、给姐姐打电话拨打电话号码 打电话给12315、打电话给18015888888拨打常用黄页名 打电话给中国电信、给上海银行打电话接听/挂断/重拨/回拨接听 接听/接电话/接通电话/接听电话挂断 挂断/挂电话/挂断电话/挂掉电话重拨 重拨电话回拨 回拨电话对话设计对话设计是基于人们的对话的设计语言,它集合多个设计的内容,其中包括语音用户界面设计、交互设计、视觉设计、动画设计、语音对话脚本设计、乃至还有音频设计增加语音助手的灵动性。对话设计的是否成功与否最重要的就是个性,现在市场上的许多车载语音系统对话听起来还是基本很相似,是因为很多公司都没有专业的对话设计师,要么是程序员、产品经理、好一点的公司组建一个语音组,都是从其他行业转化过来,然后将各个大厂的语音对话研究一下,就上岗了,国内优秀的 VUI 设计真的很稀缺,也是很缺少的人才,我可不想再用语音交互的时候语音助手和我说“对不起,我没懂你的意思”对话设计师在规划用户在具体每个功能模块区域内做什么,同时还要考虑用户的需求和技术限制,对话的策略,是代表着该语音系统完整的用户体验,也包含这详细的规范定义流程和底层逻辑。这边需要着重的讲一个小知识点:我们会有一个误区,认为“对话”仅只是说 or 听到的内容,其实对话本质上是多模态的,对话的核心内容是对话的流程和底层逻辑,图形界面的逻辑一般都不太会用在对话内容的设计方面,基本上他们两是一个独立的个体。对话设计需要注意点1. 语音简短化车载语音的对话做的是否 OK?是基于对话内容时间的长短,因为用户没办法像查看 UI 界面内容那样,去查看语音的内容。根据人的平均记忆力,如果车载语音虚拟形象说了,关于这个话题很多内容,用户可能无法记全所有的内容,这对于对话将大打折扣,因此在对话过程中需要严格遵循 简短明了,让每一个文字都有意义,避免重复的短语,可以让用户快速的做决定。2. 响应等待设计当用户在用导航功能的时候,语音对话说“导航去火车站”,如果在上海的话,就有好几个火车站,需要用户再次去选择,1 虹桥火车站、2 上海火车站、3 上海南站、4 上海西站,我们在做项目的时候,体验设计师给他的定义是如果用户超过 8 秒还没有进行选择的话,默认是选择第一个,如果第一个目的地不是我想要的,那么我需要重新通过语音再次输入信息。我觉得默认选择这个选项可能会有些不妥,如果这期间来一个电话或者是微信的语音电话,那么我是不好通过语音去选择的,如果汽车不是在驾驶的状态,可以手动触控屏幕进行选择 OK 没问题,如果是驾驶状态下,就需要优化前面默认选择项了。我的想法(1)超过 8 秒钟后,默认选择第一个没有问题,但是在用户结束自己之前任务状态后,可以说重新选择目的地,将之前的搜索出来的火车站结果都再次调出来,提供用户重新去选择。(2)这块就更智能化一些了(这个有一点前瞻性的意思,研发要是看到这个需求估计要揍死我),当语音助手检测用户正在忙的状态时候,在 8 秒钟都没有做出选择,那么语音助手可以从第一个目的地开始播报,用户可以通过方向盘 OK 硬按键去选择自己所需要导航的目的地,在驾驶过程中,方向盘的硬按键安全性远高于中控屏幕的点击。3. 避免过多的选择给用户提供选择的选项列表的时,最好不要超过三个选项,给用户较少的选择,能够让用户更明确去抉择,减少过多选项对于用户的干扰,刚刚上面导航那个案例排除,上海火车站真的太多了没办法,其他城市应该还好都是 1-3 个左右。我的想法上面实际案例就是强行逼迫用户去选择一个,这种体验很差,有一种场景,如果这三个选项都不是我想要的,你就得重新说,帮我推荐一下附近的餐厅,想想这种体验就不是我想要的,我觉得可以增加一些情感化的设计在里面,如果这三个选项都不是我想要的。我可能会说“这些我都不想去、能不能帮我再推荐其他的”语音助手说“你可真挑食、好的,那我就再帮你找找其他美食”(我的意思就是要让机器多去自我学习,更加智能化、情感化贴近于用户的交流,这样用户才会更愿意使用语音交互)上诉的场景是对于这块区域不熟悉的用户来搜寻美食,如果用户有直接目的需要吃什么类型的餐饮的时候,语言助手只需要推荐相关美食就好。用户说“帮我找一下附近的海底捞”语音助手说“附近有三家海底捞,您是要去哪一家…(播报三家信息)”(播报三家海底捞的位置和距离,甚至我想是不是可以增加排队人数的播报,如果排队人很多就可以换一家,接下来就可以和语音助手直接说帮我预约好位置,省的用户到店面还要进行排队等候)4. 不要假设用户知道该做什么在做对话设计的时候千万别考虑用户的思考逻辑,每个人的思考逻辑都不一样的,所以不用去猜想用户的想法,只需要提供有用的信息让用户自己选择好了,前面有提到对话设计是讲究有逻辑性的,你在设计对话剧本的时候不可能就只考虑一条线。举个简短的例子,你在设计一个订购飞机票语音对话流程,你想法是,首先先确定目的地,哪里起飞去哪里,然后再选择时间点起飞。假设用户直接说:“帮我预定早上八点的飞机,飞往深圳。”那问题来了一开始是用户是说的时间,最后只说了目的地,没有有说出发地,因此在语音设计剧本的时候,你需要将所有能出现的状况都考虑进去。5. 语言文案设计一致性在图形设计之前 UE 也需要将动词、名词之间的搭配提前定义好,需要全局保持一致性,这块内容有在我第二篇文章提到过,因此在对话设计过程中也要格外注意。6. 不要信息轰炸用户现实中我们正常处理事物的时候,也是将事物划分成几块,然后按照计划步骤进行,而不是一股脑子乱做,车载语音设计也是如此,作为一个正常的用户来说,我们一次性说出的需求并不会很多,不会像专业的车机测试人员一样,去叙述一大堆信息去检测机器的运转效率,和一个处理信息的准确性,每次出差去南京走查,都会听到测试人员巴拉巴拉 一直说,我脑袋都大了,所以我们正常用户都是逐步的去说消息的,举个列子7. 避免使用专业术语举一个场景的例子,当你在道路上开车,需要停在路边接朋友,朋友还没有到达指定位置,或者该位置是不可以停留的,语音助手正确说法“这边不可以停车,不然交警叔叔会罚款的,赶紧溜,我帮你找一个附近可以停车的地方吧” 错误的说法:“你触犯了了我国《交通法》第 XXX 条,……此处省略法律条文这边是禁止停车的”首先当你听到触犯法律,你的第一想法 what?这是什么鬼,给用户的感觉是很糟糕的,因为法律消息通常会包含长阅读并且还不自然的语言,给用户带了不好的体验,并且还未给解决的方案。一个好的语言设计方案会让人喜欢上使用它。最后来个总结:后续我会对于前瞻性的语音进行探索,再写一篇。前瞻性的就再举一个吧:通过面部扫描,检测到用户不开心的时候,车载系统可以推荐一些治愈系的电台,或者可以让用户放松、舒缓心理的的歌曲,或者你进行人机交谈(这个就比较高级,需要让语音系统进行大数据自我学习,达到能够和人能正常交流),让我们一起展望未来吧。文章中如有不足之处,欢迎补充交流,我们下期见阿里设计师:语音交互设计的流程及方法全面总结随着移动智能终端和云计算的快速发展,人工智能的浪潮正在悄然颠覆着我们生活的点点滴滴,VUI(Voice User Interface,语音用户界面)作为一个新的领域也在快速发展,并对用户体验提出了更多关于语言学、情感塑造、逻辑搭建等方面的新要求,本文结合参与的项目,将语音交互设计的发展、阅读文章 > 本篇来源:优设网原文地址:https://www.uisdc.com/hmi-vui-design
音乐 环境 电台 如果在工作、念书或休息时想要来点背景音乐,但又觉得听流行音乐很容易使人分心或焦躁,那么可以试试看选择「Lo-Fi」风格的音乐,相对于高保真(Hi-Fi)来说 Lo-Fi 音乐显得不太细腻,或是很单调无趣,不断循环的节拍反而听起来很平静,不容易因为华丽的配乐或人声而难以专心,之前介绍过几个适合在工作或读书时使用的 Lo-Fi 音乐网站:想放松休息?试下这个有16种解压音乐的免费网站!如果有在听音乐的话,一定有听过「Hi-Fi」(High Fidelity)这个专业术语,简单来说高保真就是与原有声音高度相似的重放声音,可以打造出有如亲临现场般的的完美聆听感受,因此有不少音响设备会强调 Hi-Fi。阅读文章 > 酷站两连发!矢量雪花图免费生成器+在线解压网站今天为大家带来两个动听、美丽又实用的网站。阅读文章 > 本文要推荐「Lofly」是一个结合环境背景音和 Lo-Fi 音乐的免费服务,提供各种环境声音像是雨声、打雷、下雪、营火、森林、鸟叫声、划船、风声、叶子、咖啡店、农场、键盘、海洋、图书馆、夜晚、道路、电风扇、风铃、电车、体育场、脚步声、时钟和办公室,搭配上 Lo-Fi 音乐电台打造适合各种情境的背景音乐。Lofly 收录 18 种 Lo-Fi 音乐电台,依照音乐类型、适合情境(例如工作、睡觉、读书)、国家地区或是心情分类,选择音乐、开启不同模式的环境背景音让空间变得不过度安静,也能保持专注,特别适合搭配耳机使用。iOS 15 也有内建「背景声音」功能,透过不同的大自然声音降低干扰保持专注。Lofly网站链接:https://www.lofly.site/使用教学开启 Lofly 从左侧选择要使用的环境背景音效,点选就能开启、调整音量或是静音关闭,有像是雨声、打雷、下雪、营火等等环境音可用。如果不确定要怎么搭配组合,Lofly 在上方有生产力、专注或放松模式,选择后会开启对应的环境背景音效,或是点选随机来产生特定组合也很有趣。点选左下角「Click to Change」切换收听的音乐电台,有各种类型、适合情境或心情分类,点选就能马上加入播放器播放,不喜欢就重复此步骤重新选择其他电台。每个环境音都能单独调整音量大小,或设定为静音不播放音效。比较有趣的是 Lofly 也有聊天室和西红柿钟(Pomodoro)功能,从上方选单开启,预设情况就是 25 分钟的专心时间和 5 分钟休息,对于要将 Lofly 拿来做为专心工作或读书来说会很有帮助。将环境背景音效和电台频道选好,Lofly 就是非常称职的音乐播放器啰!搭配上耳机的话确实有一种身临其境的感觉,适合需要专心、来点音乐但又不想因此而受到干扰的朋友使用。值得一试的三个理由:Lofly 结合环境背景音和 Lo-Fi 音乐,提高用户的生产力提供雨声、打雷、下雪、营火、森林、鸟叫声各种环境音可调大小声18 种 Lo-Fi 音乐电台,亦有西红柿钟和聊天室功能本篇来源:优设网原文地址:https://www.uisdc.com/lofly