最专业的八方代购网站源码!

资讯热点
关于智能语音交互的5分

发布时间:2021-6-13 分类: 电商动态

本文是我在学习智能语音过程中的思考,希望能从智能语音的人机交互层面带来一些启发。

当我还是个孩子的时候,我喜欢一个名为《恐龙战队》的剧本。有一个叫做“Alpha”的角色。这是一个每天都很忙的机器人。能够召唤玩家并与他们交流是非常好奇的。

今天,由于智能语音技术的发展和一些语音产品的出现,我们对可以说话的机器并不那么陌生。 Siri曾经成为全民的话题。这绝对不是Apple的初衷。这暴露了它的不完美之处,使公众更接近语音产品。本文是我在学习智能语音过程中的思考,希望能从智能语音的人机交互层面带来一些启发。

语言是人类文明的重要成就,也是人类最重要的工具之一。它在保护和传播人类文明方面发挥着不可或缺的作用。总之,它的主要作用是四个字:传递信息。

“我们称之为智能语音,学术界称之为”自然语言处理“,是计算机科学和人工智能领域的研究方向。它主要研究使用自然语言在人与计算机之间有效传递信息。理论与方法。 —引自百度”

“交互”是“人机交互”的全称,它是对系统与用户之间的交互和交互的研究。

智能语音交互的简洁声音应该是自然语言交互。为了便于理解,我仍然使用“智能语音交互”这个词。

计算机技术和人工智能领域发展迅速,对“自然语言处理”的研究也非常火爆。

siri,微软小冰,谷歌,Echo,Keda Xunfei,京东等智能语音产品也开始出现。虽然存在很大的不完善之处,但回顾历史,我们可以发现智能语音技术一直在进行中。

在理解智能语音的过程中,我遇到了一些问题。我想到围绕这些问题的智能语音交互,希望能给你带来一些灵感。

 1、智能语音能成为人类主流的人机交互方式吗?

这个问题引起了很多争议,我更喜欢智能语音交互将成为主流的人机交互方法之一。

人类与世界万物互动的过程可能是这样的:通过眼睛观察人,事,物,环境等,辅以耳朵听觉,鼻子气味,舌头味道,口腔交流,身体接触,然后大脑产生记忆和思考并做出行动,表达,语言和生理反馈,这个过程是循环和组合的。

不同的环境和习惯会有所不同,但基本上都在这个范围内。在这个过程中,上半部分主要是接收信息,下半部分主要负责沟通和互动,语言和行动是最重要的沟通和互动形式。

从人机交互的角度来看,手动操作是世界的绝对主流

我们每天使用的手机,电脑,相机和汽车,包括现在非常热的AR和VR设备,基本上都是手动控制的。 (手控属于行动类别)这与人类进化的方式有很大关系。我们的祖先开始学习制作工具,手成为人类接触万物的最重要工具。

特别是机械的出现,只有灵巧双手的双手才能准确掌控任务。

然而,人手中存在一些缺陷:不够长,不够,以及需要匹配眼睛,这给我们的生活带来了很多不便。

例如:

当我们开车时,我们的眼睛和手被占用,操作手机,中央控制触摸屏等非常不方便,并且风险因素将大大增加。

原始语言是人们之间交流的工具,很难直接对象之类的对象作出反应。但随着第四次工业革命的到来,人工智能使我们更有可能。当机器能够理解我们的意思并且表现良好时,许多场景的人机交互将会改变。将会拍摄更合适的场景,就像智能​​手机进入我们的生活一样。十年前,我们无法想象用我们的手机做我们现在做的大部分事情。

所以我的意见是:

 智能语音技术会成为人类主流的人机交互方式之一。

其中一个原因是除了声音之外,原始的手部操作,体感操作,面部表情识别,注意力识别,甚至情绪波动都可能成为我们在不同场景下与机器交互的方式。在未来,这很可能是一次全面的互动体验。

  2、智能语音技术发展到什么阶段了?

智能语音分为近场语音和远场语音。

"近场定义为小于一个波长(或波长水平)的电磁场。远场是电磁波传播到远处后的场(分布)。 ——引自百度”

近场语音主要基于手机等设备,基本上有一些辅助使用要求,Siri和微软小兵都是近场语音产品。远场声音也越来越受到关注。亚马逊的Echo是远场声音,非常受欢迎。至少用户可以用它来发声以在5米的距离播放音乐。

自然语言理解已经研究了60多年。虽然它仍然不完美,但令人欣慰的是像Siri和Echo这样的产品正在兴起,而且不再是虚幻的概念。

简要了解自然语音处理的技术过程:

当我们与机器交互时,机器需要声学处理我们的声音和周围环境,以减少干扰和噪音。语音识别技术用于将听到的声音翻译成单词,语义理解技术分析单词的含义。最后,机器执行用户指令或合成要通过语音合成技术表达的语音。

在这个过程中,声学处理,语音识别,语义理解等属于自然语言理解,语音合成等都是自然语言生成,这些都是非常核心的技术,还配合人工智能,机器深度学习等等。 。

但在现阶段,仍然非常困难。

在真实环境中,由于噪音,机器仍然不允许听自然语言。当机器将听到的语音翻译成文本,重音,重音模糊,语法模糊等时,也会影响成功率。人类语言过于复杂,受到模糊词边界,多义词,句法模糊,语境理解等的影响。语义理解是一个主要障碍。

另一个例子:

如果上一年没有开设课程,那就是“去年有多少学生没有通过这门课程”。问题是机器回答“没有通过”和“去年没有打开这个课程”?同时,该机还需要提前存储“去年未打开此课程”的信息。

我认为,在我们年轻的时候,我们并不了解我们现在所知道的知识和信息。这是一个难以想象的数据量!因此,在这个阶段,在垂直领域开发智能语音产品是一个相对现实的选择。

 3、智能语音交互与界面交互的异同点是什么?

研究智能语音与机器之间的相互作用,我们不得不说界面交互,这是一种用户和设计师非常熟悉的人机交互方法。从界面交互中,实际上有许多要思考或学习的要点。

界面交互是线性的,而语音交互是非线性的

界面交互是一种线性交互方法,本质上不同的页面通过不同的层次关系串联连接。因此,当我们使用它时,会有一层图层返回,标签导航开关,回到应用主页和主页按钮回到手机桌面概念。

语音交互不适合这样做。当我们人类用语言交流时,它就是一种非线性的分歧。当我们谈论一个话题时,我们会突然转向另一个不相关的话题。它们之间没有层次关系。不能谈论回归关系。

界面交互更多过程,语音交互直接指向结果

界面交互在设计中,向用户提供了许多“小任务”(按钮点击,模块选择,页面跳转等),并且用户通过不同的组合进行选择以最终实现他们的目标。

但是在语音交互的情况下,更多的是直接表达,你会告诉服务员:请给我一杯咖啡。不是说:请用杯子从咖啡壶里倒一杯咖啡。

 界面交互可以没有目标,语音交互需要准确的目标

当我们使用计算机和移动电话访问互联网时,有时它是无目的的,但如果你在语音交互产品上没有任何目的,它会非常烦人,因为你必须继续说话。

 语音交互的私密性更强,没有界面交互覆盖的使用场景多

当我们处于拥挤的状态时,我们可以毫无顾忌地使用手机和ipad,但如果我们与机器进行语音对话,那将非常尴尬。例如,从ATM取款时,您是否使用语音?

因此,在语音交互高效的某些场景中,避免这种令人尴尬的情绪非常重要。其他更亲密的场景,语音交互可能是一场灾难。

 4、智能语音交互适合哪些使用场景?

无论任何产品的交互方式如何,都没有使用场景,不能满足用户的需求,也不可能成功。智能语音产品也不例外,从目前的技术角度来看,垂直使用场景更适合智能语音交互。

汽车的车载智能语音系统中有许多商用产品。是否有可能挖出其他旅行场景,例如骑自行车?

儿童的娱乐和教育也适用于语音交互式切割,并且有许多公司正在这样做。

智能语音产品也可以应用于客户服务行业,既可以大大降低人员成本,又可以解决语音客户服务体验效率低的问题。

手动客户服务和非智能语音客户服务方案的痛点

如果您使用智能语音系统?理想情况与手动客户服务没有什么不同,但它完全由机器完成。想想节省了多少人工成本。甚至可以替换离线客户服务工作。

智能语音助手等4种产品可帮助用户处理一些短路目的任务。

还有办公区,智能家居等等。……

 5、如何设计使用体验好的智能语音产品?

无论是界面产品还是语音产品,最终目标都是解决人们的问题。界面产品设计的一些标准和经验仍然适用。

例如,在设计过程中,还需要了解业务诉求,用户诉求,进行用户研究,分析用户特征和观察用户行为,探索使用场景中的问题和难点,并整理任务流程,设计信息体系结构和方案设计,以及验证和迭代。

在语音交互过程中,您需要注意以下问题:

 流程简单,路径明确,最大限度减少对话轮数。

语音交互应该避免不间断的对话,太多的会话用户难以记住,并且可能非常烦人。

 信息传达简洁明了,避免大量内容。

用户的短期记忆是有限的,用户难以记住太多信息。

 给予用户适当的引导,避免或及时纠正用户发散式思维导致的错误。

用户的语言表达是非常高的自由度,这增加了机器识别的难度,并且适当的引导允许用户返回到正确的路径。

系统状态反馈,及时有效。

语音交互中的系统状态反馈,让用户知道当前状态,上下文和用户进程的位置。

任何时刻都是“首页”。

语音交互是用户的快捷方式,需要直接说出来,而不是返回主页然后查找应用程序。

 加载过程要快。

在界面交互中,页面在3秒内加载,并且状态反馈对用户是可接受的。语音交互用户会更加不耐烦,因此加载过程更快,就像人与人之间的对话一样自然,以满足用户。

固定的、舒适的声音风格,令用户愉悦。

固定音乐,铃声,给用户留下印象,让人们在听到产品时知道产品是什么。例如,微信,iphone铃声,新闻链接标题。声音,悦耳的声音,音乐和铃声很重要,它们是产品气质的表达。

 与机器的语音交流如何像人类一样自然?

这是最后一个问题,我仍然没有答案。与人类不同,机器的语音通信始终是最大的问题,因为只有人与人之间的沟通才是最自然和最舒适的。如何让机器学习和模仿人类,让它慢慢地让自然人“进化”?

以上只是分析和思考。它尚未经过实践验证。我只希望能激励你。

« 京东产品操作说明|如何编写运营计划?简单! | 在网页中使用这10种字体的方式并没有让人感到低 »