600字范文 > 语音交互方法装置设备及存储介质与流程

语音交互方法装置设备及存储介质与流程

时间：2020-06-14 10:33:56

相关推荐

语音交互方法装置设备及存储介质与流程

本发明涉及语音识别技术领域，尤其涉及一种语音交互方法、装置、设备及存储介质。

背景技术：

空调、电风扇等家电设备已成为人们必不可少的产品，随着人工智能技术的快速发展，具备语音识别功能的家电产品也层出不穷，极大的改善着我们与家电产品的交互和体验。

语音识别功能应用于家庭环境，不仅可以提供本机设备的控制功能，同时也可以提供丰富的内容源及第三方服务，儿童语音的声学和语言学特性随着年龄急剧变化,而且与成人之间存在很大的差异。儿童的说话特点从直观上来说，儿童语音的语速普遍较慢，一字一顿较多。故而，直接采用目前的系统来识别儿童语音，识别性能明显较低。

技术实现要素：

本发明的主要目的在于提供一种语音交互方法、装置、设备及存储介质，旨在解决现有技术中对儿童语音识别性能较低的技术问题。

为实现上述目的，本发明提供一种语音交互方法，所述语音交互方法包括以下步骤：

在当前交互模式处于儿童模式时，获取用户的语音指令；

对所述语音指令进行语音识别，获得与所述语音指令对应的至少两个文本信息；

对所述文本信息进行拼接，获得拼接结果；

基于预设内容源对所述拼接结果进行自然语言处理，获得交互信息；

对所述交互信息进行语音播放。

可选地，所述基于预设内容源对所述拼接结果进行自然语言处理，获得交互信息的步骤，包括：

对所述拼接结果进行文字删减处理，获得多个进行删减处理后的删减文本；

从多个所述删减文本中选取待处理文本；

基于预设内容源对所述待处理文本进行自然语言处理，获得交互信息。

可选地，所述从多个所述删减文本中选取待处理文本的步骤，包括：

对所述删减文本进行遍历；

计算遍历到的当前删减文本与预设语句集合中各语句的匹配率；

将计算的匹配率中的最大值作为所述当前删减文本的匹配率；

在对所述删减文本遍历结束后，将匹配率最高的删减文本作为待处理文本。

可选地，所述在当前交互模式处于儿童模式时，获取用户的语音指令的步骤之前，所述语音交互方法还包括：

获取语音信号；

根据所述语音信号通过基于深度识别技术的唤醒词识别模型进行类型识别，在类型识别结果为儿童时，将当前交互模式设置为儿童模式；或，对所述语音信号进行语音识别，在语音识别结果中具有预设语句时，将当前交互模式设置为儿童模式。

可选地，所述获取语音信号的步骤，包括：

通过麦克风确定声源位置；

根据所述目标声源位置采用波束成形算法通过麦克风采集语音信号。

可选地，所述在当前交互模式处于儿童模式时，获取用户的语音指令的步骤，包括：

在当前交互模式处于儿童模式时，通过预设语音端点检测算法获取用户的语音指令，所述预设语音端点检测算法为增加空挡时间窗口长度的语音端点检测算法。

可选地，所述基于预设内容源对所述拼接结果进行自然语言处理，获得交互信息的步骤之前，所述语音交互方法还包括：

将具有预设标签的内容源作为预设内容源，所述预设标签为用于表征内容源适合儿童的标签；

或，

将预设儿童内容源集合中的内容源作为预设内容源。

此外，为实现上述目的，本发明还提供一种语音交互装置，所述语音交互装置包括：

指令获取模块，用于在当前交互模式处于儿童模式时，获取用户的语音指令；

语音识别模块，用于对所述语音指令进行语音识别，获得与所述语音指令对应的至少两个文本信息；

文本拼接模块，用于对所述文本信息进行拼接，获得拼接结果；

语言处理模块，用于基于预设内容源对所述拼接结果进行自然语言处理，获得交互信息；

语音播放模块，用于对所述交互信息进行语音播放。

此外，为实现上述目的，本发明还提供一种语音交互设备，所述语音交互设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音交互程序，所述语音交互程序配置为实现如上所述的语音交互方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有语音交互程序，所述语音交互程序被处理器执行时实现如上所述的语音交互方法的步骤。

本发明在当前交互模式处于儿童模式时，会对用户的语音指令进行语音识别，获得与所述语音指令对应的至少两个文本信息，对所述文本信息进行拼接，基于预设内容源对所述拼接结果进行自然语言处理，获得交互信息，对所述交互信息进行语音播放。本实施例在当前交互模式处于儿童模式时，不再将语音指令对应的各文本信息作为独立的信息，而是将其进行拼接后，对所述拼接结果进行自然语言处理，从而提高了儿童语音的识别性能。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的语音交互设备结构示意图；

图2为本发明语音交互方法第一实施例的流程示意图；

图3为本发明语音交互方法第二实施例的流程示意图；

图4为本发明语音交互方法第三实施例的流程示意图；

图5为本发明语音交互装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的语音交互设备结构示意图。

如图1所示，所述语音交互设备可以包括：处理器1001，例如cpu，网络接口1002，存储器1003。网络接口1002可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1003可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1003可选的还可以是独立于前述处理器1001的存储语音交互设备。

在具体实现中，所述语音交互设备即可为家电设备(例如：空调、电视机、洗衣机及电风扇等设备)，还可为智能手机、笔记本电脑、个人电脑及平板电脑等电子设备，本实施例对此不加以限制。

本领域技术人员可以理解，图1中示出的结构并不构成对所述语音交互设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1003中可以包括操作系统、网络通信模块以及语音交互程序。

所述语音交互设备通过处理器1001调用存储器1003中存储的语音交互程序，并执行以下操作：

在当前交互模式处于儿童模式时，获取用户的语音指令；

对所述语音指令进行语音识别，获得与所述语音指令对应的至少两个文本信息；

对所述文本信息进行拼接，获得拼接结果；

基于预设内容源对所述拼接结果进行自然语言处理，获得交互信息；

对所述交互信息进行语音播放。