100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 车辆控制方法 装置 存储介质及控制终端与流程

车辆控制方法 装置 存储介质及控制终端与流程

时间:2018-08-20 00:59:09

相关推荐

车辆控制方法 装置 存储介质及控制终端与流程

本申请涉及车辆控制领域,具体涉及一种车辆控制方法、装置、存储介质及控制终端。

背景技术:

随着互联网技术的发展,汽车产业也基于互联网技术开发出更多利于车辆驾驶的功能,包括语音控制功能、定速巡航功能、自动驾驶功能等,语音控制功能需要对用户发出的语音进行准确、有效的识别,而目前,在语音交互过程中,大多通过语音助手进行交互,而在与语音助手交互的过程中,若想要执行某个操作时,用户需要精准地说出预定的执行词,比如,语音助手才能准确地识别出用户所要执行的操作的语义出来,才能进行下一步操作,对于用户独特的发音或语言习惯,无法准确地识别出用户语音的语义,进而无法让车辆及时地对用户进行响应。

技术实现要素:

为克服以上技术问题,特别是现有技术无法准确、高效地识别用户语音的问题,特提出以下技术方案:

第一方面,本申请提供了一种车辆控制方法,包括:

接收用户发出的语音;

获取当前的语音场景,确定当前的语音场景下的词库;所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;

获取所述语音的关键词,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;

根据所述执行命令响应词控制车辆进行响应。

进一步的,所述根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词,包括:

根据所述关键词在所述语音场景下的用户个人词库中匹配;

若所述关键词命中所述用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;

若所述关键词不能命中所述用户个人词库中的任一识别词,根据所述关键词在所述语音场景下的公共词库中匹配;

若所述关键词命中所述公共词库中的任一识别词,确定所述关键词对应的执行命令响应词。

进一步的,所述执行命令响应词包括肯定响应词和否定响应词;所述语音场景下的用户个人词库通过以下方法生成:

获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;

根据所述关键词匹配所述语音场景对应的肯定响应词;

向用户发送相应的确认信息;

若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定;或,

获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;

根据所述关键词匹配所述语音场景对应的否定响应词;

向用户发送相应的确认信息;

若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定。

进一步的,所述将所述关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定之后,还包括:

获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定;

所述将所述关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定之后,还包括:

获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定。

进一步的,所述语音场景下的用户个人词库通过以下方法生成:

获取用户的身份标识,根据所述身份标识读取不同的语音场景的用户个人词库;

获取用户自定义的不同语音场景下的关键词;

将所述关键词添加至该语音场景下的用户个人词库,并与对应的执行命令响应词绑定。

进一步的,生成不同语音场景下的用户个人词库之后,还包括:

将不同语音场景下的用户个人词库上传至远端服务器;

所述语音场景下的公共词库通过以下方法生成:

统计同一语音场景下各用户的用户个人词库中同一识别词的数量;

若所述识别词的数量大于预设值,将该识别词添加进该语音场景下的公共词库;

所述方法还包括:

接收远端服务器下发的公共词库的差分更新包,更新相应语音场景下的本地公共词库。

进一步的,所述根据所述执行命令响应词控制车辆进行响应,包括:

获取车辆当前的行驶状态;

判断车辆在所述行驶状态下根据所述执行命令响应词进行响应是否影响驾驶安全;

若是,向用户发送手动操作的提示信息;

若否,根据所述执行命令响应词控制车辆进行响应。

第二方面,本申请提供一种车辆控制装置,包括:

接收模块:用于接收用户发出的语音;

语音场景模块:用于获取当前的语音场景,确定当前的语音场景下的词库;所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;

匹配模块:用于获取所述语音的关键词,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;

响应模块:用于根据所述执行命令响应词控制车辆进行响应。

第三方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述的车辆控制方法。

第四方面,本申请还提供了一种控制终端,所述控制终端包括一个或多个处理器、存储器、一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的车辆控制方法。

本申请与现有技术相比,具有以下有益效果:

本申请提供了一种基于不同语音场景对用户发出的语音进行针对性识别并基于识别出的语音在该语音场景下进行车辆控制的方法,在接收用户发出的语音后,为了更准确地识别用户发出的语音,结合用户发出语音时的语音场景,确定当前的语音场景下的词库,不同语音场景下的词库不完全相同,然后将接收到用户的语音进行处理得到所述语音包含的关键词,再根据所述关键词在上述确定的语音场景下的词库中进行匹配,当在词库中匹配成功时,即所述关键词命中所述词库中已有的识别词时,即可确定所述关键词对应的执行命令响应词,所述执行命令响应词预先绑定了该语音场景下所执行的操作,然后根据所述执行命令响应词控制车辆进行响应。通过设置不同语音场景的词库,基于不同语音场景下的词库准确、快速地识别用户的语音的语义,确定用户语音的关键词对应的该语音场景下的执行命令响应词,然后根据所述执行命令响应词预先绑定了执行的操作控制车辆进行响应,能够让车辆准确、快速地对当前语音场景下用户的语音进行响应,解决当前语音交互机械化、单一化的问题。

本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本申请车辆控制方法的一实施例流程示意图;

图2为本申请车辆控制方法的另一实施例流程示意图;

图3为本申请车辆控制方法的又一实施例流程示意图;

图4为本申请车辆控制装置的一实施例示意图;

图5为本申请控制终端的一实施例结构示意图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

本申请实施例提供一种车辆控制方法,如图1所示,所述方法包括以下步骤:

S10:接收用户发出的语音。

本实施例可以应用于车载语音助手中,通过车载语音助手实现人、机、车的交互与控制,本实施例中,车载语音助手实时监测用户发出的语音,若监测到用户发出的语音是与车载语音助手的进行交互的语音,接收用户发出的语音。本实施例的一种应用场景,车载语音助手发出询问信息,然后监测用户对所述询问信息的回复,当监测到用户发出语音时接收用户发出的语音;本实施例的另一种应用场景,用户在驾车途中需要帮助而发出语音,车载语音助手实时监测用户发出的语音,当监测到用户发出语音是与车载语音助手的进行交互的语音时接收用户发出的语音。

S20:获取当前的语音场景,确定当前的语音场景下的词库。所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;

在接收到用户发出的语音后,为了更准确地识别用户发出的语音,本实施例中,获取当前的语音场景,即确定用户发出语音时的场景,然后确定当前的语音场景下的词库,为了便于管理,本实施例设计不同语音场景下的词库不完全相同,词库中包含的词定义为识别词,即不同语音场景下的词库所包含的识别词不同,例如在语音场景“音乐播放”下的词库中包含“是”、“好”、“行”、“播放”、“开始”、“不要”、“别放”、“跳过”等识别词;在语音场景“天窗控制”下的词库中包含“开”、“好”、“行”、“开吧”、“不开”、“别开”、“别动”等识别词。通过设置不同语音场景的词库,能够快速地确定当前语音场景的词库,后续能够快速地在当前语音场景的词库中进行关键词匹配。

进一步的,本实施例中,所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;公共词库中存储有基础的通用识别词,用户个人词库中存储有具有用户个人语音习惯、特征的识别词。

S30:获取所述语音的关键词,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词。

在接收到用户的语音后,对所述语音进行切词处理,得到所述语音包含的关键词,并且上述确定了所述语音的语音场景后,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,判断所述关键词能否命中公共词库或个人词库中已有的识别词,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,则确定所述关键词对应的执行命令响应词,本实施例中,无论是公共词库或个人词库中的识别词,识别词与执行命令响应词存在多对一的关系,即多个识别词与一个执行命令响应词相对应,当命中了公共词库和/或个人词库中任一识别词后,便可确定对应的执行命令响应词。通过公共词库与用户个人词库的结合,使得语音场景下的词库中具有更多的识别词以识别用户语音的关键词,让语音互动体验更加自然,容错率更高,更高效、准确地进行语音识别。

S40:根据所述执行命令响应词控制车辆进行响应。

本实施例中,在确定了所述关键词对应的执行命令响应词后,即可确定用户发出的语音的语义,所述执行命令响应词预先绑定了该语音场景下所执行的操作,然后根据所述执行命令响应词控制车辆进行响应。具体的,所述词库中多个识别词与同一执行命令响应词相对应,当用户的语音中的关键词在词库中匹配得到任一识别词时,即可确定相应的执行命令响应词。本实施例基于不同语音场景下的词库准确、快速地对用户的语音进行识别,确定用户语音的语义,确定用户语音的关键词对应的该语音场景下的执行命令响应词,然后根据所述执行命令响应词预先绑定了执行的操作控制车辆进行响应,能够让车辆准确、快速地对当前语音场景下用户的语音进行响应。

本实施例的一种应用场景,车载语音助手播报内容“周杰伦新专辑上线了,是否播放”,然后实时监测用户的语音回复,接收用户发出的语音,然后对该语音进行切词处理,从而获取所述语音包含的关键词,再获取当前的语音场景为“音乐播放”,确定当前的语音场景“音乐播放”的词库,从词库中进行匹配,确定用户的语音包含的关键词是否命中词库中的识别词,当命中时,便能匹配所述关键词对应的执行命令响应词,然后根据所述执行命令响应词控制车辆进行响应。

本实施例提供了一种基于不同语音场景对用户发出的语音进行针对性识别并基于识别出的语音在该语音场景下进行车辆控制的方法,在接收用户发出的语音后,为了更准确地识别用户发出的语音,结合用户发出语音时的语音场景,确定当前的语音场景下的词库,不同语音场景下的词库不完全相同,然后将接收到用户的语音进行处理得到所述语音包含的关键词,再根据所述关键词在上述确定的语音场景下的词库中进行匹配,当在词库中匹配成功时,即所述关键词命中所述词库中已有的识别词时,即可确定所述关键词对应的执行命令响应词,所述执行命令响应词预先绑定了该语音场景下所执行的操作,然后根据所述执行命令响应词控制车辆进行响应。通过设置不同语音场景的词库,基于不同语音场景下的词库准确、快速地识别用户的语音的语义,确定用户语音的关键词对应的该语音场景下的执行命令响应词,然后根据所述执行命令响应词预先绑定了执行的操作控制车辆进行响应,能够让车辆准确、快速地对当前语音场景下用户的语音进行响应,解决当前语音交互机械化、单一化的问题。

本申请的一种实施例,如图2所示,所述根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词,包括:

S310:根据所述关键词在所述语音场景下的用户个人词库中匹配;

S311:若所述关键词命中所述用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;

S312:若所述关键词不能命中所述用户个人词库中的任一识别词,根据所述关键词在所述语音场景下的公共词库中匹配;

S313:若所述关键词命中所述公共词库中的任一识别词,确定所述关键词对应的执行命令响应词。

本实施例中,在根据所述关键词在所述语音场景下的词库中进行匹配时,优先在该语音场景下的个人词库中进行匹配,即根据所述关键词在所述语音场景下的用户个人词库中匹配,若所述关键词命中所述用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;若所述关键词在个人词库中匹配不到相应的识别词,则根据所述关键词在所述语音场景下的公共词库中匹配,若所述关键词命中所述公共词库中的任一识别词,确定所述关键词对应的执行命令响应词。根据用户语音的关键词优先从具有用户语音特征、语音习惯的用户个人词库匹配,从而能够更准确地进行关键词的搜索与匹配,同时,用户个人词库中具有的识别词数量较公共词库中具有的识别词数量少,从而能够更快速地进行关键词的搜索与匹配。

本申请的一种实施例,所述执行命令响应词包括肯定响应词和否定响应词;所述语音场景下的用户个人词库通过以下方法生成:

获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;

根据所述关键词匹配所述语音场景对应的肯定响应词;

向用户发送相应的确认信息;

若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定;或,

获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;

根据所述关键词匹配所述语音场景对应的否定响应词;

向用户发送相应的确认信息;

若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定。

上述本实施例中不同语音场景下的用户个人词库需要采集用户的语音进行分析、处理而得到,本实施例中,所述执行命令响应词包括肯定响应词和否定响应词,即在同一语音场景下,可以确定的执行命令响应词包括肯定响应词和否定响应词,肯定响应词与否定响应词所预先绑定的操作不同。例如语音场景“音乐播放”的肯定响应词为“播放音乐”,与播放音乐的操作预先绑定,否定响应词为“不播放音乐”,与不播放音乐的操作预先绑定。本实施例的一种实施方式,语所述音场景下的用户个人词库通过以下方法生成,获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;根据所述关键词匹配所述语音场景对应的肯定响应词;向用户发送相应的确认信息;若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定;本实施例的另一种实施方式,获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;根据所述关键词匹配所述语音场景对应的否定响应词;向用户发送相应的确认信息;若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定。例如,语音场景“音乐播放”下获取的用户语音的关键词为“播吧”,此时匹配的肯定响应词“播放音乐”,然后向用户发送播放音乐的确认信息,当接收到用户的确认指令后,将关键词“播吧”添加至“音乐播放”语音场景下的用户个人词库,并与肯定响应词“播放音乐”绑定,后续若在音乐播放的语音场景下接收到用户的语音中包含有关键词“播吧”,则可确定执行命令响应词“播放音乐”。

本申请的一种实施例,所述将所述关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定之后,还包括:

获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定;

所述将所述关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定之后,还包括:

获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定。

本实施例中,不同的语音场景下的用户个人词库中收集了用户在该语音场景下的多个关键词后,基于收集到的多个关键词进行自我学习处理,获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定,或获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定,从而不断丰富不同语音场景下的用户个人词库中的识别词,进而不断提高关键词的命中率,从而提高语音识别的容错率及效率,保证车辆能够快速地对用户发出的语音进行响应。

本申请的一种实施例,所述语音场景下的用户个人词库通过以下方法生成:

获取用户的身份标识,根据所述身份标识读取不同的语音场景的用户个人词库;

获取用户自定义的不同语音场景下的关键词;

将所述关键词添加至该语音场景下的用户个人词库,并与对应的执行命令响应词绑定。

不同语音场景下的用户个人词库中的识别词可以通过上述实施例引导用户在不同语音场景下进行语音答复而收集得到,本实施例中,不同语音场景下的用户个人词库还可以通过用户自定义生成,同时考虑到同一车辆可能存在多位用户使用的现象,本实施例在同一车辆中能够保存有不同用户的用户个人词库。具体的,所述语音场景下的用户个人词库通过以下方法生成,获取用户的身份标识,然后根据身份标识读取不同的语音场景的用户个人词库,同一用户在不同语音场景下的用户个人词库不同,不同用户在同一语音场景下的用户词库亦不同,然后获取用户自定义的不同语音场景下的关键词,并将所述关键词添加至该语音场景下的用户个人词库,并与对应的执行命令响应词绑定。例如,用户A在语音场景“音乐播放”,自定义关键词“赶紧的”、“赶紧开始”、“播吧”、“播啊”,然后将该些关键词添加至“音乐播放”语音场景下的用户A的个人词库中,并与对应的执行命令响应词“播放音乐”绑定,后续若在“音乐播放”语音场景下接收到用户A的语音中包含关键词“赶紧的”,即可确定该关键词对应的执行命令响应词“播放音乐”,然后控制车辆进行响应,播放相应的音乐。

本申请的一种实施例,生成不同语音场景下的用户个人词库之后,还包括:

将不同语音场景下的用户个人词库上传至远端服务器;

所述语音场景下的公共词库通过以下方法生成:

统计同一语音场景下各用户的用户个人词库中同一识别词的数量;

若所述识别词的数量大于预设值,将该识别词添加进该语音场景下的公共词库;

所述方法还包括:

接收远端服务器下发的公共词库的差分更新包,更新相应语音场景下的本地公共词库。

本实施例中,不同用户通过在车辆上的车载语音助手的个人词库的自定义,生成不同语音场景下的用户个人词库,然后将不同语音场景下的用户个人词库上传至远端服务器,而公共词库便可通过不同用户的用户个人词库进行丰富、扩展,具体的,统计同一语音场景下各用户的用户个人词库中同一识别词的数量,若同一语音场景下统计得到的用户个人词库存在的某一识别词的总数量大于预设值,则确定该识别词具有通用、通俗的表达习惯,此时将该识别词添加进该语音场景下的公共词库中,完成对公共词库的拓展,进一步的,各车辆上的车载语音助手便可接收远端服务器下发的公共词库的差分更新包,通过差分更新包将公共词库新增的识别词添加,完成本地公共词库的更新,从而丰富本地公共词库,从而能够提高语音识别的准确性跟效率,尤其是第一次与车载语音助手进行交互的用户,更加丰富的公共词库能够提高用户语音识别的效率。

本申请的一种实施例,如图3所示,所述根据所述执行命令响应词控制车辆进行响应,包括:

S410:获取车辆当前的行驶状态;

S411:判断车辆在所述行驶状态下根据所述执行命令响应词进行响应是否影响驾驶安全;

S421:若是,向用户发送手动操作的提示信息;

S413:若否,根据所述执行命令响应词控制车辆进行响应。

在确定了执行命令响应词后,需要根据所述执行命令响应词控制车辆进行响应,考虑车辆处于不同的行驶状态作出不同的响应可能存在一定的危险,本实施例中,在根据所述执行命令响应词控制车辆进行响应时,获取车辆当前的行驶状态,包括获取车辆当前的车速、轮胎胎压、导航目的地距离、剩余油量、剩余电量等行驶状态,然后判断车辆在所述行驶状态下根据所述执行命令响应词进行响应是否影响驾驶安全,或是否影响驾驶要求,若是,则向用户发送手动操作的提示信息,将车辆的控制权更多地交还给用户,让用户根据车辆实际的行驶状态确定是否进行响应;若否,则根据所述执行命令响应词控制车辆进行响应,自动完成车辆的响应,从而提高人车交互的效率,避免用户过多分心而影响驾驶安全。

如图4所示,在另一种实施例中,本申请提供了一种车辆控制装置,包括:

接收模块10:用于接收用户发出的语音;

语音场景模块20:用于获取当前的语音场景,确定当前的语音场景下的词库;所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;

匹配模块30:用于获取所述语音的关键词,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;

响应模块40:用于根据所述执行命令响应词控制车辆进行响应。

本申请的一种实施例,所述匹配模块30还包括执行;

根据所述关键词在所述语音场景下的用户个人词库中匹配;

若所述关键词命中所述用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;

若所述关键词不能命中所述用户个人词库中的任一识别词,根据所述关键词在所述语音场景下的公共词库中匹配;

若所述关键词命中所述公共词库中的任一识别词,确定所述关键词对应的执行命令响应词。

本申请的一种实施例,所述执行命令响应词包括肯定响应词和否定响应词,所述装置还包括:

用户个人词库模块:用于获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;根据所述关键词匹配所述语音场景对应的肯定响应词;向用户发送相应的确认信息;若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定;或,

获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;根据所述关键词匹配所述语音场景对应的否定响应词;向用户发送相应的确认信息;若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定。

本申请的一种实施例,所述用户个人词库模块还包括执行:

获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定;或,获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定。

本申请的一种实施例,所述用户个人词库模块还包括执行:

获取用户的个人词库中已绑定的若干组识别词及对应的标准词;

获取用户的身份标识,根据所述身份标识读取不同的语音场景的用户个人词库;

获取用户自定义的不同语音场景下的关键词;

将所述关键词添加至该语音场景下的用户个人词库,并与对应的执行命令响应词绑定。

本申请的一种实施例,所述装置还包括:

上传模块:用于将不同语音场景下的用户个人词库上传至远端服务器;

更新模块:用于接收远端服务器下发的公共词库的差分更新包,更新相应语音场景下的本地公共词库;

所述语音场景下的公共词库通过如下生成:

统计同一语音场景下各用户的用户个人词库中同一识别词的数量;

若所述识别词的数量大于预设值,将该识别词添加进该语音场景下的公共词库。

本申请的一种实施例,所述响应模块40还包括执行:

获取车辆当前的行驶状态;

判断车辆在所述行驶状态下根据所述执行命令响应词进行响应是否影响驾驶安全;

若是,向用户发送手动操作的提示信息;

若否,根据所述执行命令响应词控制车辆进行响应。

在另一种实施例中,本申请提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例所述的车辆控制方法。其中,所述计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储设备包括由设备(例如,计算机、手机)以能够读的形式存储或传输信息的任何介质,可以是只读存储器,磁盘或光盘等。

本申请实施例提供的一种计算机可读存储介质,可实现接收用户发出的语音;获取当前的语音场景,确定当前的语音场景下的词库,所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;获取所述语音的关键词,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;根据所述执行命令响应词控制车辆进行响应。通过提供一种基于不同语音场景对用户发出的语音进行针对性识别并基于识别出的语音在该语音场景下进行车辆控制的方法,在接收用户发出的语音后,为了更准确地识别用户发出的语音,结合用户发出语音时的语音场景,确定当前的语音场景下的词库,不同语音场景下的词库不完全相同,然后将接收到用户的语音进行处理得到所述语音包含的关键词,再根据所述关键词在上述确定的语音场景下的词库中进行匹配,当在词库中匹配成功时,即所述关键词命中所述词库中已有的识别词时,即可确定所述关键词对应的执行命令响应词,所述执行命令响应词预先绑定了该语音场景下所执行的操作,然后根据所述执行命令响应词控制车辆进行响应。通过设置不同语音场景的词库,基于不同语音场景下的词库准确、快速地识别用户的语音的语义,确定用户语音的关键词对应的该语音场景下的执行命令响应词,然后根据所述执行命令响应词预先绑定了执行的操作控制车辆进行响应,能够让车辆准确、快速地对当前语音场景下用户的语音进行响应,解决当前语音交互机械化、单一化的问题。

本申请实施例提供的计算机可读存储介质可以实现上述车辆控制方法的实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。

此外,在又一种实施例中,本申请还提供一种控制终端,所述控制终端可以为车辆(包括车辆上安装的智能终端),通过车辆上安装的智能终端实现以上实施例所述的车辆控制方法,如图5所示,所述控制终端包括处理器503、存储器505、输入单元507以及显示单元509等器件。本领域技术人员可以理解,图5示出的结构器件并不构成对所有控制终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件。所述存储器505可用于存储计算机程序501以及各功能模块,所述处理器503运行存储在存储器505的计算机程序501,从而执行设备的各种功能应用以及数据处理。所述存储器505可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。

输入单元507用于接收信号的输入及接收用户的输入,输入单元507可包括触控面板以及其它输入设备,触控面板可收集用户在其上或附近的触摸操作,并根据预先设定的程序驱动相应的连接装置。显示单元509可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元509可采用液晶显示器、有机发光二极管等形式。处理器503是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储器503内的软件程序和/或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。

在一种实施方式中,所述控制终端包括一个或多个处理器503,以及一个或多个存储器505,一个或多个计算机程序501,其中所述一个或多个计算机程序501被存储在存储器505中并被配置为由所述一个或多个处理器503执行,所述一个或多个计算机程序501配置用于执行以上实施例所述的语音识别方法。图5中所示的一个或多个处理器503能够执行、实现图4中所示的接收模块10、语音场景模块20、匹配模块30、响应模块40的功能。

本申请实施例提供的一种控制终端,可实现接收用户发出的语音;获取当前的语音场景,确定当前的语音场景下的词库;所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;获取所述语音的关键词,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;根据所述执行命令响应词控制车辆进行响应。通过提供一种基于不同语音场景对用户发出的语音进行针对性识别并基于识别出的语音在该语音场景下进行车辆控制的方法,在接收用户发出的语音后,为了更准确地识别用户发出的语音,结合用户发出语音时的语音场景,确定当前的语音场景下的词库,不同语音场景下的词库不完全相同,然后将接收到用户的语音进行处理得到所述语音包含的关键词,再根据所述关键词在上述确定的语音场景下的词库中进行匹配,当在词库中匹配成功时,即所述关键词命中所述词库中已有的识别词时,即可确定所述关键词对应的执行命令响应词,所述执行命令响应词预先绑定了该语音场景下所执行的操作,然后根据所述执行命令响应词控制车辆进行响应。通过设置不同语音场景的词库,基于不同语音场景下的词库准确、快速地识别用户的语音的语义,确定用户语音的关键词对应的该语音场景下的执行命令响应词,然后根据所述执行命令响应词预先绑定了执行的操作控制车辆进行响应,能够让车辆准确、快速地对当前语音场景下用户的语音进行响应,解决当前语音交互机械化、单一化的问题。

本申请实施例提供的控制终端可以实现上述提供的车辆控制方法的实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。

以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

技术特征:

1.一种车辆控制方法,其特征在于,包括以下步骤:

接收用户发出的语音;

获取当前的语音场景,确定当前的语音场景下的词库;所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;

获取所述语音的关键词,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;

根据所述执行命令响应词控制车辆进行响应。

2.根据权利要求1所述的方法,其特征在于,所述根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词,包括:

根据所述关键词在所述语音场景下的用户个人词库中匹配;

若所述关键词命中所述用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;

若所述关键词不能命中所述用户个人词库中的任一识别词,根据所述关键词在所述语音场景下的公共词库中匹配;

若所述关键词命中所述公共词库中的任一识别词,确定所述关键词对应的执行命令响应词。

3.根据权利要求1所述的方法,其特征在于,所述执行命令响应词包括肯定响应词和否定响应词;所述语音场景下的用户个人词库通过以下方法生成:

获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;

根据所述关键词匹配所述语音场景对应的肯定响应词;

向用户发送相应的确认信息;

若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定;或,

获取不同的语音场景及用户在对应语音场景下回复的语音的关键词;

根据所述关键词匹配所述语音场景对应的否定响应词;

向用户发送相应的确认信息;

若接收到用户的确认指令,将所述关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定。

4.根据权利要求3所述的方法,其特征在于,所述将所述关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定之后,还包括:

获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述肯定响应词绑定;

所述将所述关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定之后,还包括:

获取同一语音场景下的关键词的语音特征,根据所述语音特征生成新的关键词,将所述新的关键词添加至该语音场景下的用户个人词库,并与所述否定响应词绑定。

5.根据权利要求1所述的方法,其特征在于,所述语音场景下的用户个人词库通过以下方法生成:

获取用户的身份标识,根据所述身份标识读取不同的语音场景的用户个人词库;

获取用户自定义的不同语音场景下的关键词;

将所述关键词添加至该语音场景下的用户个人词库,并与对应的执行命令响应词绑定。

6.根据权利要求1所述的方法,其特征在于,生成不同语音场景下的用户个人词库之后,还包括:

将不同语音场景下的用户个人词库上传至远端服务器;

所述语音场景下的公共词库通过以下方法生成:

统计同一语音场景下各用户的用户个人词库中同一识别词的数量;

若所述识别词的数量大于预设值,将该识别词添加进该语音场景下的公共词库;

所述方法还包括:

接收远端服务器下发的公共词库的差分更新包,更新相应语音场景下的本地公共词库。

7.根据权利要求1所述的方法,其特征在于,所述根据所述执行命令响应词控制车辆进行响应,包括:

获取车辆当前的行驶状态;

判断车辆在所述行驶状态下根据所述执行命令响应词进行响应是否影响驾驶安全;

若是,向用户发送手动操作的提示信息;

若否,根据所述执行命令响应词控制车辆进行响应。

8.一种车辆控制装置,其特征在于,包括:

接收模块:用于接收用户发出的语音;

语音场景模块:用于获取当前的语音场景,确定当前的语音场景下的词库;所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;

匹配模块:用于获取所述语音的关键词,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;

响应模块:用于根据所述执行命令响应词控制车辆进行响应。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的车辆控制方法。

10.一种车辆控制终端,其特征在于,包括:

一个或多个处理器;

存储器;

一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于执行根据权利要求1至7任一项所述的车辆控制方法。

技术总结

本申请涉及车辆控制领域,具体涉及一种车辆控制方法、装置、存储介质及控制终端,所述方法包括:接收用户发出的语音;获取当前的语音场景,确定当前的语音场景下的词库;所述语音场景下的词库包括语音场景下的公共词库及语音场景下的用户个人词库;获取所述语音的关键词,根据所述关键词在所述语音场景下的公共词库和/或用户个人词库中匹配,若所述关键词命中所述公共词库和/或用户个人词库中的任一识别词,确定所述关键词对应的执行命令响应词;根据所述执行命令响应词控制车辆进行响应。本申请解决用户个性化的语音可能导致无法识别的问题,提高语音识别的准确率及效率,提高对车辆的控制效率。

技术研发人员:李娟

受保护的技术使用者:广州小鹏汽车科技有限公司

技术研发日:.06.04

技术公布日:.09.06

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。