600字范文,内容丰富有趣,生活中的好帮手!
600字范文 > 语音唤醒方法 装置 设备及存储介质与流程

语音唤醒方法 装置 设备及存储介质与流程

时间:2019-04-24 09:18:51

相关推荐

语音唤醒方法 装置 设备及存储介质与流程

本申请实施例涉及人机交互领域,特别涉及一种语音唤醒方法、装置、设备及存储介质。

背景技术:

在人机交互领域,为了便于用户对设备进行控制,以及提高人机交互乐趣,对于具有语音功能的电子设备,用户可以通过语音唤醒技术来对其进行唤醒。语音唤醒是指在电子设备处于休眠状态时,通过特定的唤醒词唤醒设备,使电子设备从休眠状态切换为工作状态,开始为用户进行服务。

相关技术中,为了节省电子设备的功耗,可以在电子设备中配置第一处理器和第二处理器,且第一处理器的功耗小于第二处理器的功耗。语音唤醒检测时,电子设备可以先启动低功耗的第一处理器,通过第一处理器进行语音监听,若监听到语音数据,则通过第一处理器的第一语音唤醒算法对监听到的语音数据进行语音识别;若通过第一处理器识别到监听到的语音数据中包括指定唤醒词,则将第一处理器由工作状态切换为休眠状态,并启动第二处理器,通过第二处理器的第二语音唤醒算法对监听到的语音数据进一步进行语音识别;若通过第二处理器识别到语音数据中包括指定唤醒词,则对电子设备进行唤醒;若通过第二处理器识别到语音数据中不包括指定唤醒词,则将第二处理器从工作状态切换为休眠状态,并重新启动第一处理器,通过第一处理器继续进行语音监听。

采用上述语音唤醒方法,电子设备在进行语音唤醒的过程中,虽然能够在低功耗的第一处理器和高功耗的第二处理器之间来回切换,从而降低电子设备的功耗,但是在一定程度上也会限制电子设备的性能,影响到语音唤醒通过率。

技术实现要素:

本申请实施例提供了一种语音唤醒方法、装置、设备及存储介质。所述技术方案如下:

一方面,本申请实施例提供了一种语音唤醒方法,所述方法包括:

检测电子设备的设备状态,所述电子设备中配置有多个处理器,且所述多个处理器的功耗不同;

根据所述电子设备的设备状态,确定所述电子设备所处的功耗模式,从所述多个处理器中确定与所述电子设备所处的功耗模式匹配的处理器;

通过与所述电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对所述电子设备进行语音唤醒。

另一方面,提供了一种语音唤醒装置,所述装置包括:

检测模块,用于检测电子设备的设备状态,所述电子设备中配置有多个处理器,且所述多个处理器的功耗不同;

确定模块,用于根据所述电子设备的设备状态,确定所述电子设备所处的功耗模式,从所述多个处理器中确定与所述电子设备所处的功耗模式匹配的处理器;

识别模块,用于通过与所述电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对所述电子设备进行语音唤醒。

另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器;所述存储器存储有至少一条指令,所述至少一条指令用于被所述处理器执行以实现上述语音唤醒方法。

另一方面,提供了计算机可读存储介质,其特征在于,所述存储介质存储有至少一条指令,所述至少一条指令用于被处理器执行以实现上述语音唤醒方法。

另一方面,还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令用于被处理器执行以实现上述语音唤醒方法。

本申请提供的技术方案至少可以带来以下有益效果:

本申请实施例中,通过先检测电子设备的设备状态,然后根据电子设备的设备状态,确定电子设备所处的功耗模式,通过与电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对电子设备进行语音唤醒,实现了针对不同的功耗模式,采用不同功耗的处理器进行语音唤醒的识别和检测,如此可以结合电子设备的实际使用场景,通过多种语音唤醒模式的切换确保在功耗可接受的前提下保证设备性能,平衡了设备的功耗和性能,避免了对语音唤醒通过率的影响。

附图说明

图1是本申请实施例提供的一种语音唤醒方法的流程图;

图2是本申请实施例提供的另一种语音唤醒方法的流程图;

图3是本申请实施例提供的一种功耗模式转换的语音唤醒过程示意图;

图4是本申请实施例提供的另一种语音唤醒方法的流程图;

图5是本申请实施例提供的另一种功耗模式转换的语音唤醒过程示意图;

图6是本申请实施例提供的一种语音唤醒装置的装置框图;

图7是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

在对本申请实施例进行详细介绍之前,先对本申请实施例的实施环境进行介绍。本申请实施例提供的语音唤醒方法应用于电子设备中,该电子设备可以为智能音箱、智能电视、智能可穿戴设备或终端等,终端可以为手机、平板电脑或计算机等。以该电子设备为终端为例,终端可以采用本申请实施例提供的方法采集外界的语音数据,识别语音数据中是否包含特定的唤醒词,根据识别结果对终端进行唤醒。

相关技术中,在各种复杂场景下一般只采用一种固定的语音唤醒方案来进行语音唤醒,比如先经过低功耗的第一处理器进行语音识别,当通过第一处理器识别到采集的语音数据中存在指定唤醒词之后,再启动高功耗的第二处理器进行语音识别,这种方式在一定程度上能够降低终端功耗,但是在电子设备本身处于高功耗模式的时候,也就没有必要考虑功耗的限制,应当利用更多的资源来提升性能,因为语音唤醒处理所带来的功耗相对于电子设备本身的功耗很小,几乎可以忽略,这种场景下更应该关注用户体验,如果先经过低功耗第一处理器,会因为资源以及功耗的限制,影响到唤醒通过率。

本申请实施例中,为了解决相关技术中存在的问题,提供了一种能够在复杂场景下平衡电子设备的功耗和性能的语音唤醒方法,即多场景混合模式的语音唤醒方法,详见下述图1实施例。

图1是本申请实施例提供的一种语音唤醒方法的流程图,该方法应用于电子设备中,如图1所示,该方法包括如下步骤:

步骤101:检测电子设备的设备状态,电子设备中配置有多个处理器,且多个处理器的功耗不同。

其中,电子设备的设备状态可以包括屏幕状态和声音输出状态,还可以包括其他设备状态,比如内存状态和环境噪声状态等。

其中,屏幕状态包括熄屏状态和亮屏状态。声音输出状态包括有声音输出的状态和没有声音输出的状态。作为一个示例,声音输出状态用于指示电子设备的喇叭是否有声音输出,即电子设备是否正在播放音频或音视频。

其中,电子设备可以配置有功耗不同的多个处理器。比如,电子设备可以包括两种不同功耗的处理器,即第一处理器和第二处理器,且第一处理器的功耗小于第二处理器的功耗。

或者,电子设备也配置三种不同功耗的处理器。比如,电子设备配置有第一处理器和第二处理器,且第二处理器包括第一子处理器和第二子处理器,第一子处理器和第二子处理器的功耗均大于第一处理器,第一子处理器的功耗小于第二子处理器的功耗。

当然,电子设备也可以包括四个或四个以上的不同功耗的处理器,本申请实施例对此不做限定。

步骤102:根据电子设备的设备状态,确定电子设备所处的功耗模式,从多个处理器中确定与电子设备所处的功耗模式匹配的处理器。

本申请实施例中,可以根据电子设备的设备状态,将电子设备划分为多种不同的功耗模式,不同的设备状态对应于不同的功耗模式。而且,电子设备中配置有多个处理器,不同的功耗模式与不同的处理器匹配,用于在对应功耗模式下采样与之匹配的处理器进行语音唤醒处理。

作为一个示例,若将电子设备的功耗模式划分为两种功耗模式,且电子设备配置的多个处理器包括第一处理器和第二处理器,第一处理器的功耗小于第二处理器的功耗,则根据电子设备的设备状态,确定电子设备所处的功耗模式,从多个处理器中确定与电子设备所处的功耗模式匹配的处理器可以包括以下两种情况:

第一种情况:若电子设备的屏幕状态为熄屏状态,且电子设备的声音输出状态为没有声音输出的状态,则确定电子设备所处的功耗模式为第一功耗模式,将第一处理器和第二处理器确定为与第一功耗模式匹配的处理器。

其中,第一功耗模式是指低功耗模式。当电子设备的屏幕状态为熄屏状态,且电子设备没有声音输出时,可以将此时电子设备所处的功耗模式确定为低功耗模式,并将第一处理器和第二处理器确定为与低功耗模式匹配的处理器,以先通过第一处理器进行语音识别,再通过第二处理器进行语音识别。

作为一个示例,第一处理器为低功耗处理器,第二处理器为功耗大于第一处理器的高功耗处理器。示例的,第一处理器为dsp(digitalsignalprocessor,数字信号处理器)、hifi(high-fidelity,高保真)芯片或ceva(思华)芯片等。第二处理器可以为arm(advancedriscmachine,精简指令集微处理器)、adsp(analogdeviceinstrumentdsp,美国模拟器件公司生产的数字信号处理芯片)或cm4(cortex-m4,一种处理器)等。

作为一个示例,第一处理器采用第一语音唤醒算法对监听的语音数据进行语音识别,以识别语音数据中是否存在指定唤醒词;第二处理器采用第二语音唤醒算法对监听的语音数据进行语音识别,以识别语音数据中是否存在指定唤醒词。而且,第一语音唤醒算法的语音识别准确度小于第二语音唤醒算法。

第二种情况:若电子设备的屏幕状态为亮屏状态和/或电子设备的声音输出状态为有声音输出的状态,则确定电子设备所处的功耗模式为第二功耗模式,将第二处理器确定为与第二功耗模式匹配的处理器。

其中,第二功耗模式的功耗大于第一功耗模式的功耗。比如,第一功耗模式为低功耗模式,第二功耗模式为高功耗模式。

当电子设备的屏幕状态为亮屏状态,或者电子设备有语音输出时,可以将此时电子设备所处的功耗模式确定为高功耗模式,并将第二处理器确定为与高功耗模式匹配的处理器,以便不再经过第一处理器,直接通过高功耗的第二处理器进行语音识别,提高设备性能和唤醒通过率。

本申请实施例中,当电子设备处于低功耗模式时,可以采用与低功耗模式匹配的低功耗语音唤醒方案进行语音监听和识别。如果电子设备由低功耗模式切换至高功耗模式,则可以将低功耗语音唤醒方案切换为与高功耗模式匹配的高功耗语音唤醒方案进行语音监听和识别。如果电子设备由高功耗模式切换至低功耗模式,则可以将高功耗语音唤醒方案切换为与低功耗语音唤醒方案进行语音监听和识别。也即是,随着电子设备所处功耗模式的切换,可以随之切换合适的语音唤醒方案,使得电子设备能够应对复杂的使用场景,通过多种语音唤醒方案的切换确保在功耗可接受的前提下,保证设备性能,带来较佳的唤醒体验。

作为另一示例,还可以将电子设备的功耗模式划分为三种功耗模式,并在电子设备中配置功耗不同的三种处理器,然后从这三种处理器中分别确定与每种功耗模式匹配的处理器。

在一种可能的实现方式中,第二功耗模式可以包括打断(bargeln)模式和高功耗模式,打断模式和高功耗模式的功耗均大于第一功耗模式,第二处理器包括第一子处理器和第二子处理器,第一子处理器和第二子处理器的功耗均大于第一处理器,且第一子处理器的功耗小于第二子处理器的功耗,则根据电子设备的设备状态,确定电子设备所处的功耗模式,从多个处理器中确定与电子设备所处的功耗模式匹配的处理器可以包括以下三种情况:

第一种情况:若电子设备的屏幕状态为熄屏状态,且电子设备的声音输出状态为没有声音输出的状态,则确定电子设备所处的功耗模式为第一功耗模式,将第一处理器和第一子处理器确定为与第一功耗模式匹配的处理器。

其中,第一功耗模式是指低功耗模式。当电子设备的屏幕状态为熄屏状态,且电子设备没有声音输出时,可以将此时电子设备所处的功耗模式确定为低功耗模式,并将第一处理器和第一子处理器确定为与低功耗模式匹配的处理器,以便先通过第一处理器进行语音识别,再通过第一子处理器进行语音识别。

作为一个示例,第一处理器采用第一语音唤醒算法对监听的语音数据进行语音识别,以识别语音数据中是否存在指定唤醒词;第一子处理器采用第二语音唤醒算法对监听的语音数据进行语音识别,以识别语音数据中是否存在指定唤醒词。而且,第一语音唤醒算法的语音识别准确度小于第二语音唤醒算法。

第二种情况:若电子设备的屏幕状态为亮屏状态或熄屏状态,且电子设备的声音输出状态为有声音输出的状态,则确定电子设备所处的功耗模式为打断模式,将第一子处理器和第二子处理器确定为与打断模式匹配的处理器。

由于第一子处理器和第二子处理器的功耗均大于第一处理器,且第一子处理器的功耗小于第二子处理器的功耗,因此,可以将第一处理器称为低功耗处理器,第一子处理器称为次功耗处理器,第二子处理器称为高功耗处理器。

当电子设备的声音输出状态为有声音输出的状态时,说明此时电子设备正在播放音频,此时电子设备不仅能够监听到用户的唤醒语音,还能够监听到电子设备本身发出的声音,这种情况下可以将电子设备所处的功耗模式确定为打断模式。当电子设备处于打断模式时,可以将第一子处理器和第二子处理器确定为与打断模式匹配的处理器,以便先通过第一子处理器进行语音识别,再通过第二子处理器进行语音识别。

作为一个示例,第一子处理器采用第三语音唤醒算法对监听的语音数据进行语音识别,以识别语音数据中是否包括指定唤醒词;第二子处理器采用第二语音唤醒算法对监听的语音数据进行语音识别,以识别语音数据中是否包括指定唤醒词。而且,第三语音唤醒算法的语音识别准确度小于第二语音唤醒算法。

第三种情况:若电子设备的屏幕状态为亮屏状态,且电子设备的声音输出状态为没有声音输出的状态,则确定电子设备所处的功耗模式为高功耗模式,将第二子处理器确定为与高功耗模式匹配的处理器。

其中,第二子处理器为高功耗处理器。当电子设备处于亮屏状态,且没有声音输出时,可以将此时电子设备所处的功耗模式确定为高功耗模式,并将第二子处理器确定为与高功耗模式匹配的处理器,以便不再经过第一处理器或第一子处理器,而是直接通过高功耗的第二子处理器进行语音识别,从而提高设备性能和唤醒通过率。

本申请实施例中,当电子设备处于低功耗模式时,可以采用与低功耗模式匹配的低功耗语音唤醒方案进行语音监听和识别。如果电子设备由低功耗模式切换至打断模式,则可以将低功耗语音唤醒方案切换为与打断模式匹配的次高功耗语音唤醒方案进行语音监听和识别。如果电子设备由打断模式切换至高功耗模式,则可以将次高功耗语音唤醒方案切换为与高功耗语音唤醒方案进行语音监听和识别。也即是,当电子设备在低功耗模式、打断模式和高功耗模式之间切换时,电子设备可以随之切换匹配的语音唤醒方案,使得电子设备能够应对复杂的使用场景,通过多种语音唤醒方案的切换确保在功耗可接受的前提下,保证设备性能,带来较佳的语音唤醒体验。

步骤103:通过与电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对电子设备进行语音唤醒。

作为一个示例,若将电子设备的功耗模式划分为两种功耗模式,且电子设备配置的多个处理器包括第一处理器和第二处理器,第一处理器的功耗小于第二处理器的功耗,则通过与电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对电子设备进行语音唤醒可以包括以下两种情况:

第一种情况:若电子设备所处的功耗模式为第一功耗模式,则通过第一处理器进行语音监听,若监听到语音数据,则采用第一语音唤醒算法对监听到的语音数据进行语音识别;若通过第一处理器识别到语音数据中包括指定唤醒词,则通过第二处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别。

进一步地,在通过第二处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别之后,若通过第二处理器识别到语音数据中包括指定唤醒词,可以直接触发唤醒电子设备,也可以再通过第二处理器对语音数据进行声纹识别,若识别到的声纹特征与存储的声纹特征匹配,则触发唤醒电子设备。

第二种情况:若电子设备所处的功耗模式为第二功耗模式,则通过第二处理器进行语音监听,若监听到语音数据,则采用第二语音唤醒算法对监听到的语音数据进行语音识别。

进一步地,在采用第二语音唤醒算法对监听到的语音数据进行语音识别之后,若通过第二处理器识别到语音数据中包括指定唤醒词,可以直接触发唤醒电子设备,也可以再通过第二处理器对语音数据进行声纹识别,若识别到的声纹特征与存储的声纹特征匹配,则触发唤醒电子设备。

作为另一示例,还可以将电子设备的功耗模式划分为三种功耗模式,并在电子设备中配置功耗不同的三种处理器,然后从这三种处理器中分别确定与每种功耗模式匹配的处理器。

在一种可能的实现方式中,若第二功耗模式包括打断模式和高功耗模式,第二处理器包括第一子处理器和第二子处理器,则通过与电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对电子设备进行语音唤醒可以包括以下三种情况:

第一种情况:若电子设备所处的功耗模式为第一功耗模式,则通过第一处理器进行语音监听,若监听到语音数据,则采用第一语音唤醒算法对监听到的语音数据进行语音识别;若通过第一处理器识别到语音数据中包括指定唤醒词,则通过第二子处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别。

进一步地,在通过第二子处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别之后,若通过第二子处理器识别到语音数据中包括指定唤醒词,可以直接触发唤醒电子设备,也可以再通过第二子处理器对语音数据进行声纹识别,若识别到的声纹特征与存储的声纹特征匹配,则触发唤醒电子设备。

第二种情况:若电子设备所处的功耗模式为打断模式,则通过第一子处理器进行语音监听,若监听到语音数据,则对监听到的语音数据进行回声消除,采用第三语音唤醒算法对回声消除后的语音数据进行语音识别;若识别到语音数据中包括指定唤醒词,则通过第二子处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别。

由于当电子设备处于打断模式时,电子设备自身也有声音输出,此时电子设备通过第一子处理器进行语音监听时,不仅能够监听到用户的语音数据,还能监听到电子设备自身发出的声音数据,因此,为了提高语音识别的准确度,可以先对监听到的语音数据进行回声消除,以消除电子设备自身发出的声音。

第三种情况:若电子设备所处的功耗模式为高功耗模式,则通过第二子处理器进行语音监听,若监听到语音数据,则采用第二语音唤醒算法对监听到的语音数据进行语音识别。

进一步地,在采用第三语音唤醒算法对监听到的语音数据进行语音识别之后,若识别到语音数据中包括指定唤醒词,可以直接触发唤醒电子设备,也可以再通过第二子处理器对语音数据进行声纹识别,若识别到的声纹特征与存储的声纹特征匹配,则触发唤醒电子设备。

需要说明的是,本申请实施例中触发唤醒电子设备的方式包括触发电子设备亮屏,触发电子设备亮屏并解锁,触发电子设备解锁,寻找电子设备,以及唤醒电子设备的语音助手中的至少一种。

作为一个示例,若电子设备的屏幕状态为熄屏状态,则触发唤醒电子设备的方式包括:触发电子设备亮屏,触发电子设备亮屏并解锁,寻找电子设备,以及唤醒电子设备的语音助手中的至少一种。若电子设备的屏幕状态为亮屏状态,则触发唤醒电子设备的方式包括:触发电子设备解锁,寻找电子设备,以及唤醒电子设备的语音助手中的至少一种。

本申请实施例中,通过先检测电子设备的设备状态,然后根据电子设备的设备状态,确定电子设备所处的功耗模式,通过与电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对电子设备进行语音唤醒,实现了针对不同的功耗模式,采用不同功耗的处理器进行语音唤醒的识别和检测,如此可以结合电子设备的实际使用场景,通过多种语音唤醒模式的切换确保在功耗可接受的前提下保证设备性能,平衡了设备的功耗和性能,避免了对语音唤醒通过率的影响。另外,本申请实施例能够自动识别设备所处的模式,然后结合设备的特点,权衡功耗与性能的平衡。而且,可以找准低功耗和高功耗处理器的优劣势,结合设备场景特性,提出了一种混合模式的语音唤醒方案,避免了相关技术中采用固定的语音唤醒方案导致限制设备性能,影响语音唤醒通过率的问题。

接下来对将电子设备的功耗模式划分为两种功耗模式的语音唤醒方法进行举例说明。图2是本申请实施例提供的另一种语音唤醒方法的流程图,该方法应用于语音唤醒装置中,如图2所示,该方法包括如下步骤:

步骤201:检测电子设备的设备状态,设备状态包括屏幕状态和声音输出状态,电子设备中配置有低功耗处理器和高功耗处理器。

步骤202:若电子设备的屏幕状态为熄屏状态,且电子设备的声音输出状态为没有声音输出的状态,则确定电子设备处于低功耗模式。

步骤203:若电子设备处于低功耗模式,则先通过低功耗处理器进行语音监听,以及对监听到的语音数据进行语音识别,再通过高功耗处理器对语音数据进行语音识别。

作为一个示例,通过低功耗处理器进行语音监听,若监听到语音数据,则采用第一语音唤醒算法对监听到的语音数据进行语音识别;若识别到语音数据中包括指定唤醒词,则通过高功耗处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别。其中,第二语音唤醒算法的语音识别准确度大于第一语音唤醒算法。

步骤204:若通过高功耗处理器识别到语音数据中包括指定唤醒词,则通过高功耗处理器继续对语音数据进行声纹识别,若声纹识别通过,则触发唤醒电子设备。

步骤205:若电子设备的屏幕状态为亮屏状态和/或电子设备的声音输出状态为有声音输出的状态,则确定电子设备处于高功耗模式。

步骤206:若电子设备处于高功耗模式,则直接通过高功耗处理器进行语音监听,以及对监听到的语音数据进行语音识别。

作为一个示例,若电子设备处于高功耗模式,则通过高功耗处理器进行语音监听,若监听到语音数据,则采用第二语音唤醒算法对监听到的语音数据进行语音识别。

步骤207:若通过高功耗处理器识别到语音数据中包括指定唤醒词,则通过高功耗处理器对语音数据进行声纹识别,若声纹识别通过,则触发唤醒电子设备。

本申请实施例中,可以将电子设备的功耗模式划分为低功耗模式和高功耗模式,电子设备在低功耗模式和高功耗模式之间切换时,电子设备可以随之切换匹配的语音唤醒方案,使得电子设备能够应对复杂的使用场景,通过多种语音唤醒方案的切换确保在功耗可接受的前提下,保证设备性能,带来较佳的语音唤醒体验。

作为一个示例,电子设备在低功耗模式和高功耗模式之间切换时,电子设备随之切换匹配的语音唤醒方案的示意图可以如图3所示。

接下来对将电子设备的功耗模式划分为三种功耗模式的语音唤醒方法进行举例说明。图4是本申请实施例提供的又一种语音唤醒方法的流程图,该方法应用于语音唤醒装置中,如图4所示,该方法包括如下步骤:

步骤401:检测电子设备的设备状态,设备状态包括屏幕状态和声音输出状态,电子设备中配置有低功耗处理器、次高功耗处理器和高功耗处理器。

步骤402:若电子设备的屏幕状态为熄屏状态,且电子设备的声音输出状态为没有声音输出的状态,则确定电子设备处于低功耗模式。

步骤403:若电子设备处于低功耗模式,则先通过低功耗处理器进行语音监听,以及对监听到的语音数据进行语音识别,再通过高功耗处理器对语音数据进行语音识别。

作为一个示例,先通过低功耗处理器进行语音监听,若监听到语音数据,则采用第一语音唤醒算法对监听到的语音数据进行语音识别;若识别到语音数据中包括指定唤醒词,则通过高功耗处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别。其中,第二语音唤醒算法的语音识别准确度大于第一语音唤醒算法。

步骤404:若通过高功耗处理器识别到语音数据中包括指定唤醒词,则通过高功耗处理器继续对语音数据进行声纹识别,若声纹识别通过,则触发唤醒电子设备。

步骤405:若电子设备的屏幕状态为亮屏状态或熄屏状态,且电子设备的声音输出状态为有声音输出的状态,则确定电子设备处于打断模式。

步骤406:若电子设备处于打断模式,则先通过次高功耗处理器进行语音监听,以及对监听到的语音数据进行语音识别,再通过高功耗处理器对语音数据进行语音识别。

作为一个示例,若电子设备处于打断模式,先通过次高功耗处理器进行语音监听,若监听到语音数据,则通过次高功耗处理器对监听到的语音数据进行回声消除,再采用第三语音唤醒算法对回声消除后的语音数据进行语音识别,若识别到语音数据中包括指定唤醒词,再通过高功耗处理器,采用第二语音唤醒算法对语音数据进行语音识别。其中,第二语音唤醒算法的语音识别准确度大于第三语音唤醒算法。

另外,第三语音唤醒算法与上述第一语音唤醒算法可以相同也可以不同,本申请实施例对此不做限定。示例的,第三语音唤醒算法可以为多麦语音唤醒算法。

步骤407:若通过高功耗处理器识别到语音数据中包括指定唤醒词,则通过高功耗处理器继续对语音数据进行声纹识别,若声纹识别通过,则触发唤醒电子设备。

步骤408:若电子设备的屏幕状态为亮屏状态,且电子设备的声音输出状态为没有声音输出的状态,则确定电子设备处于高功耗模式。

步骤409:若电子设备处于高功耗模式,则直接通过高功耗处理器进行语音监听,以及对监听到的语音数据进行语音识别。

作为一个示例,若电子设备处于高功耗模式,则通过高功耗处理器进行语音监听,若监听到语音数据,则采用第二语音唤醒算法对监听到的语音数据进行语音识别。

步骤410:若通过高功耗处理器识别到语音数据中包括指定唤醒词,则通过高功耗处理器对语音数据进行声纹识别,若声纹识别通过,则触发唤醒电子设备。

本申请实施例中,可以将电子设备的功耗模式划分为低功耗模式、打断模式和高功耗模式,电子设备在低功耗模式、打断模式和高功耗模式之间切换时,电子设备可以随之切换匹配的语音唤醒方案,使得电子设备能够应对复杂的使用场景,通过多种语音唤醒方案的切换确保在功耗可接受的前提下,保证设备性能,带来较佳的语音唤醒体验。

作为一个示例,电子设备在低功耗模式、打断模式和高功耗模式时,电子设备随之切换匹配的语音唤醒方案的示意图可以如图5所示。

图6是本申请实施例提供的一种语音唤醒装置的装置框图,如图6所示,该装置包括:检测模块601、确定模块602和识别模块603。

检测模块601,用于检测电子设备的设备状态,所述电子设备中配置有多个处理器,且所述多个处理器的功耗不同;

确定模块602,用于根据所述电子设备的设备状态,确定所述电子设备所处的功耗模式,从所述多个处理器中确定与所述电子设备所处的功耗模式匹配的处理器;

识别模块603,用于通过与所述电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对所述电子设备进行语音唤醒。

可选地,所述电子设备的设备状态包括屏幕状态和声音输出状态。

可选地,所述多个处理器包括第一处理器和第二处理器,且所述第一处理器的功耗小于所述第二处理器的功耗;

所述确定模块602用于:

若所述电子设备的屏幕状态为熄屏状态,且所述电子设备的声音输出状态为没有声音输出的状态,则确定所述电子设备所处的功耗模式为第一功耗模式,将所述第一处理器和所述第二处理器确定为与所述第一功耗模式匹配的处理器;

若所述电子设备的屏幕状态为亮屏状态和/或所述电子设备的声音输出状态为有声音输出的状态,则确定所述电子设备所处的功耗模式为第二功耗模式,将所述第二处理器确定为与所述第二功耗模式匹配的处理器,所述第二功耗模式的功耗大于所述第一功耗模式的功耗。

可选地,所述识别模块603用于:

若所述电子设备所处的功耗模式为所述第一功耗模式,则通过所述第一处理器进行语音监听,若监听到语音数据,则采用第一语音唤醒算法对监听到的语音数据进行语音识别;若识别到所述语音数据中包括指定唤醒词,则通过所述第二处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别;

若所述电子设备所处的功耗模式为所述第二功耗模式,则通过所述第二处理器进行语音监听,若监听到语音数据,则采用所述第二语音唤醒算法对监听到的语音数据进行语音识别。

可选地,所述识别模块603用于:

若所述电子设备所处的功耗模式为所述第二功耗模式,且所述电子设备的声音输出状态为有声音输出的状态,则通过所述第二处理器进行语音监听;

若监听到语音数据,则通过所述第二处理器对监听到的声音数据进行回声消除,采用所述第二语音唤醒算法对回声消除后的语音数据进行语音识别。

可选地,所述第二功耗模式包括打断模式和高功耗模式,所述打断模式和所述高功耗模式的功耗均大于所述第一功耗模式,所述第二处理器包括第一子处理器和第二子处理器,所述第一子处理器和所述第二子处理器的功耗均大于所述第一处理器,且所述第一子处理器的功耗小于所述第二子处理器的功耗;

所述确定模块602用于:

若所述电子设备的屏幕状态为亮屏状态或熄屏状态,且所述电子设备的声音输出状态为有声音输出的状态,则确定所述电子设备所处的功耗模式为所述打断模式,将所述第一子处理器和所述第二子处理器确定为与所述打断模式匹配的处理器;

若所述电子设备的屏幕状态为亮屏状态,且所述电子设备的声音输出状态为没有声音输出的状态,则确定所述电子设备所处的功耗模式为所述高功耗模式,将所述第二子处理器确定为与所述高功耗模式匹配的处理器。

可选地,所述识别模块603用于:

若所述电子设备所处的功耗模式为所述打断模式,则通过所述第一子处理器进行语音监听,若监听到语音数据,则对监听到的语音数据进行回声消除,采用第三语音唤醒算法对回声消除后的语音数据进行语音识别;若识别到所述语音数据中包括所述指定唤醒词,则通过所述第二子处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别;

若所述电子设备所处的功耗模式为所述高功耗模式,则通过所述第二子处理器进行语音监听,若监听到语音数据,则采用所述第二语音唤醒算法对监听到的语音数据进行语音识别。

本申请实施例中,通过先检测电子设备的设备状态,然后根据电子设备的设备状态,确定电子设备所处的功耗模式,通过与电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对电子设备进行语音唤醒,实现了针对不同的功耗模式,采用不同功耗的处理器进行语音唤醒的识别和检测,如此可以结合电子设备的实际使用场景,通过多种语音唤醒模式的切换确保在功耗可接受的前提下保证设备性能,平衡了设备的功耗和性能,避免了对语音唤醒通过率的影响。

需要说明的是:上述实施例提供的语音唤醒装置在进行语音唤醒时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的语音唤醒装置与语音唤醒方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图7是本申请实施例提供的一种电子设备700的结构示意图,该电子设备可以为智能音箱、智能电视、智能可穿戴设备或终端等,终端可以为手机、平板电脑或计算机等。该电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器701和一个或一个以上的存储器702,其中,所述存储器702中存储有至少一条指令,所述至少一条指令由所述处理器701加载并执行以实现上述各个方法实施例提供的接入点的识别方法。比如,该电子设备包括低功耗处理器和高功耗处理器。或者,该电子设备包括低功耗处理器、次高功耗处理器和高功耗处理器。当然,该电子设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该电子设备还可以包括其他用于实现设备功能的部件,在此不做赘述。

本申请实施例还提供了一种计算机可读介质,该计算机可读介质存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的通话方法。

本申请实施例还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的通话方法。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本申请实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

技术特征:

1.一种语音唤醒方法,其特征在于,所述方法包括:

检测电子设备的设备状态,所述电子设备中配置有多个处理器,且所述多个处理器的功耗不同;

根据所述电子设备的设备状态,确定所述电子设备所处的功耗模式,从所述多个处理器中确定与所述电子设备所处的功耗模式匹配的处理器;

通过与所述电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对所述电子设备进行语音唤醒。

2.根据权利要求1所述的方法,其特征在于,所述电子设备的设备状态包括屏幕状态和声音输出状态。

3.根据权利要求2所述的方法,其特征在于,所述多个处理器包括第一处理器和第二处理器,且所述第一处理器的功耗小于所述第二处理器的功耗;

所述根据所述电子设备的设备状态,确定所述电子设备所处的功耗模式,从所述多个处理器中确定与所述电子设备所处的功耗模式匹配的处理器,包括:

若所述电子设备的屏幕状态为熄屏状态,且所述电子设备的声音输出状态为没有声音输出的状态,则确定所述电子设备所处的功耗模式为第一功耗模式,将所述第一处理器和所述第二处理器确定为与所述第一功耗模式匹配的处理器;

若所述电子设备的屏幕状态为亮屏状态和/或所述电子设备的声音输出状态为有声音输出的状态,则确定所述电子设备所处的功耗模式为第二功耗模式,将所述第二处理器确定为与所述第二功耗模式匹配的处理器,所述第二功耗模式的功耗大于所述第一功耗模式的功耗。

4.根据权利要求3所述的方法,其特征在于,所述通过与所述电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,包括:

若所述电子设备所处的功耗模式为所述第一功耗模式,则通过所述第一处理器进行语音监听,若监听到语音数据,则采用第一语音唤醒算法对监听到的语音数据进行语音识别;若识别到所述语音数据中包括指定唤醒词,则通过所述第二处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别;

若所述电子设备所处的功耗模式为所述第二功耗模式,则通过所述第二处理器进行语音监听,若监听到语音数据,则采用所述第二语音唤醒算法对监听到的语音数据进行语音识别。

5.根据权利要求4所述的方法,其特征在于,所述若所述电子设备所处的功耗模式为所述第二功耗模式,则通过所述第二处理器进行语音监听,若监听到语音数据,则采用所述第二语音唤醒算法对监听到的语音数据进行语音识别,包括:

若所述电子设备所处的功耗模式为所述第二功耗模式,且所述电子设备的声音输出状态为有声音输出的状态,则通过所述第二处理器进行语音监听;

若监听到语音数据,则通过所述第二处理器对监听到的声音数据进行回声消除,采用所述第二语音唤醒算法对回声消除后的语音数据进行语音识别。

6.根据权利要求3所述的方法,其特征在于,所述第二功耗模式包括打断模式和高功耗模式,所述打断模式和所述高功耗模式的功耗均大于所述第一功耗模式,所述第二处理器包括第一子处理器和第二子处理器,所述第一子处理器和所述第二子处理器的功耗均大于所述第一处理器,且所述第一子处理器的功耗小于所述第二子处理器的功耗;

所述若所述电子设备的屏幕状态为亮屏状态和/或所述电子设备的声音输出状态为有声音输出的状态,则确定所述电子设备所处的功耗模式为第二功耗模式,将所述第二处理器确定为与所述高功耗模式匹配的处理器,包括:

若所述电子设备的屏幕状态为亮屏状态或熄屏状态,且所述电子设备的声音输出状态为有声音输出的状态,则确定所述电子设备所处的功耗模式为所述打断模式,将所述第一子处理器和所述第二子处理器确定为与所述打断模式匹配的处理器;

若所述电子设备的屏幕状态为亮屏状态,且所述电子设备的声音输出状态为没有声音输出的状态,则确定所述电子设备所处的功耗模式为所述高功耗模式,将所述第二子处理器确定为与所述高功耗模式匹配的处理器。

7.根据权利要求6所述的方法,其特征在于,所述通过与所述电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,包括:

若所述电子设备所处的功耗模式为所述打断模式,则通过所述第一子处理器进行语音监听,若监听到语音数据,则对监听到的语音数据进行回声消除,采用第三语音唤醒算法对回声消除后的语音数据进行语音识别;若识别到所述语音数据中包括所述指定唤醒词,则通过所述第二子处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别;

若所述电子设备所处的功耗模式为所述高功耗模式,则通过所述第二子处理器进行语音监听,若监听到语音数据,则采用所述第二语音唤醒算法对监听到的语音数据进行语音识别。

8.一种语音唤醒装置,其特征在于,所述装置包括:

检测模块,用于检测电子设备的设备状态,所述电子设备中配置有多个处理器,且所述多个处理器的功耗不同;

确定模块,用于根据所述电子设备的设备状态,确定所述电子设备所处的功耗模式,从所述多个处理器中确定与所述电子设备所处的功耗模式匹配的处理器;

识别模块,用于通过与所述电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对所述电子设备进行语音唤醒。

9.根据权利要求8所述的装置,其特征在于,所述电子设备的设备状态包括屏幕状态和声音输出状态。

10.根据权利要求9所述的装置,其特征在于,所述多个处理器包括第一处理器和第二处理器,且所述第一处理器的功耗小于所述第二处理器的功耗;

所述确定模块用于:

若所述电子设备的屏幕状态为熄屏状态,且所述电子设备的声音输出状态为没有声音输出的状态,则确定所述电子设备所处的功耗模式为第一功耗模式,将所述第一处理器和所述第二处理器确定为与所述第一功耗模式匹配的处理器;

若所述电子设备的屏幕状态为亮屏状态和/或所述电子设备的声音输出状态为有声音输出的状态,则确定所述电子设备所处的功耗模式为第二功耗模式,将所述第二处理器确定为与所述第二功耗模式匹配的处理器,所述第二功耗模式的功耗大于所述第一功耗模式的功耗。

11.根据权利要求10所述的装置,其特征在于,所述识别模块用于:

若所述电子设备所处的功耗模式为所述第一功耗模式,则通过所述第一处理器进行语音监听,若监听到语音数据,则采用第一语音唤醒算法对监听到的语音数据进行语音识别;若识别到所述语音数据中包括指定唤醒词,则通过所述第二处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别;

若所述电子设备所处的功耗模式为所述第二功耗模式,则通过所述第二处理器进行语音监听,若监听到语音数据,则采用所述第二语音唤醒算法对监听到的语音数据进行语音识别。

12.根据权利要求11所述的装置,其特征在于,所述识别模块用于:

若所述电子设备所处的功耗模式为所述第二功耗模式,且所述电子设备的声音输出状态为有声音输出的状态,则通过所述第二处理器进行语音监听;

若监听到语音数据,则通过所述第二处理器对监听到的声音数据进行回声消除,采用所述第二语音唤醒算法对回声消除后的语音数据进行语音识别。

13.根据权利要求10所述的装置,其特征在于,所述第二功耗模式包括打断模式和高功耗模式,所述打断模式和所述高功耗模式的功耗均大于所述第一功耗模式,所述第二处理器包括第一子处理器和第二子处理器,所述第一子处理器和所述第二子处理器的功耗均大于所述第一处理器,且所述第一子处理器的功耗小于所述第二子处理器的功耗;

所述确定模块用于:

若所述电子设备的屏幕状态为亮屏状态或熄屏状态,且所述电子设备的声音输出状态为有声音输出的状态,则确定所述电子设备所处的功耗模式为所述打断模式,将所述第一子处理器和所述第二子处理器确定为与所述打断模式匹配的处理器;

若所述电子设备的屏幕状态为亮屏状态,且所述电子设备的声音输出状态为没有声音输出的状态,则确定所述电子设备所处的功耗模式为所述高功耗模式,将所述第二子处理器确定为与所述高功耗模式匹配的处理器。

14.根据权利要求13所述的装置,其特征在于,所述识别模块用于:

若所述电子设备所处的功耗模式为所述打断模式,则通过所述第一子处理器进行语音监听,若监听到语音数据,则对监听到的语音数据进行回声消除,采用第三语音唤醒算法对回声消除后的语音数据进行语音识别;若识别到所述语音数据中包括所述指定唤醒词,则通过所述第二子处理器,采用第二语音唤醒算法对监听到的语音数据进行语音识别;

若所述电子设备所处的功耗模式为所述高功耗模式,则通过所述第二子处理器进行语音监听,若监听到语音数据,则采用所述第二语音唤醒算法对监听到的语音数据进行语音识别。

15.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;所述存储器存储有至少一条指令,所述至少一条指令用于被所述处理器执行以实现如权利要求1至7任一所述的语音唤醒方法。

16.一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一条指令,所述至少一条指令用于被处理器执行以实现如权利要求1至7任一所述的语音唤醒方法。

技术总结

本申请实施例公开了一种语音唤醒方法、装置、设备及存储介质,属于人机交互领域。所述方法包括:检测电子设备的设备状态,电子设备中配置有多个处理器,且多个处理器的功耗不同;根据电子设备的设备状态,确定电子设备所处的功耗模式,从多个处理器中确定与电子设备所处的功耗模式匹配的处理器;通过与电子设备所处的功耗模式匹配的处理器,对监听到的语音数据进行语音识别,根据语音识别结果对所述电子设备进行语音唤醒。如此,实现了针对不同的功耗模式,采用不同功耗的处理器进行语音唤醒的识别和检测,平衡了设备的功耗和性能,避免了对语音唤醒通过率的影响。

技术研发人员:曹冰

受保护的技术使用者:OPPO(重庆)智能科技有限公司

技术研发日:.11.20

技术公布日:.02.28

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。