100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 多重联合认证方法 装置 计算机装置及存储介质与流程

多重联合认证方法 装置 计算机装置及存储介质与流程

时间:2023-01-29 09:42:26

相关推荐

多重联合认证方法 装置 计算机装置及存储介质与流程

本发明涉及计算机技术领域,具体涉及一种多重联合认证方法、装置、计算机装置及存储介质。

背景技术:

现在许多系统会用视频面审的方式进行用户认证,但是操作上比较不方便。例如,不同的用户采用的摄像头的分辨率不同导致拍摄的图像的清晰度等会有差别。此外,不同的用户很可能在不同环境下进行视频认证,光线强弱等环境因素也会对视频认证过程产生影响。基于这些影响,用户在执行认证的过程中往往会被误识别为非本人,导致认证失败,认证效率低下。此外,单一的视频认证也不够安全,例如采用3D面具很可能蒙混过关。

技术实现要素:

鉴于以上内容,有必要提出一种多重联合认证方法、装置、计算机装置及存储介质,用以解决视频认证效率不高的技术问题。

本发明的第一方面提供一种多重联合认证方法,所述方法包括:

获取一段预设时长的视频资料;

从所述视频资料获取N帧图像,其中,N为正整数;

计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像,其中,所述目标图像的清晰度最高;

当所述目标图像的清晰度小于预设值时,增强所述目标图像的清晰度;

从所述目标图像中提取出用户的生物特征;及

根据所提取的生物特征与预先存储的生物特征是否相匹配确定用户是否通过第一次身份验证;当用户通过所述第一次身份验证时,将所获取的视频资料转化为音频资料;

从所述音频资料中提取出用户的身份特征;

将所提取出的用户的身份特征与预定的身份特征进行比较以对用户进行第二次身份验证;及

若所提取出的用户的身份特征与预定的身份特征相匹配,则确定用户通过所述第二次身份验证;若所提取出的用户的身份特征与预定的身份特征不匹配,则确定用户没有通过所述第二次身份验证。

本实施例的优选实施方式中,所述增强所述目标图像的清晰度包括:

计算所述目标图像中的高频分量和低频分量;

对所述目标图像中的高频分量进行分类,并对分类后的高频分量进行增强处理;及

将增强后的高频分量与所述低频分量叠加得到新的目标图像。

本实施例的优选实施方式中,所述对分类后的高频分量进行增强处理包括:

计算核化降噪动态阈值,判断所述目标图像中的点是否属于噪声;

若所述目标图像中的点属于噪声,将所述目标图像中的点对应的高频分量的值设置为0;

若所述目标图像中的点不属于噪声,应用非线性高频增强曲线对所述目标图像的高频分量进行增强。

本实施例的优选实施方式中,所述判断所述目标图像中的点是否属于噪声包括:

将所述目标图像中的点的高频分量的绝对值与所述核化降噪动态阈值进行比对;

若所述目标图像中的点的高频分量的绝对值小于所述核化降噪阈值,则确认所述目标图像中的点为噪声;及

若所述目标图像中的点的高频分量的绝对值大于或等于所述核化降噪阈值,则确认所述目标图像中的点不是噪声。

本实施例的优选实施方式中,所述用户的身份特征包括用户的语速,其中,所述用户的语速定义为用户在单位时长内所念的文字个数,其中,从所述音频资料中获取用户的语速包括:

利用语音识别算法识别所述音频资料所对应的文字;

统计所识别获得的文字的总数N;及

将所述总数N除以所述音频资料所对应的时长获得所述用户的语速,其中,所述音频资料所对应的时长是指播放所述音频资料所需要的时间。

本实施例的优选实施方式中,所述用户的身份特征包括用户的语速,其中,所述用户的语速定义为用户在单位时长内所念的文字个数,其中,从所述音频资料中获取用户的语速包括:

将所述音频资料切分为M帧音频;

利用预设的音节识别器识别所述M帧音频中的每帧音频所包括的音节;

统计所述M帧音频中的每帧音频所包括的音节的数目,将每帧音频所包括的音节的数目进行加总获得所述M帧音频所包括的音节的总数S;及

将所述总数S除以所述音频资料所对应的时长获得所述用户的语速。

本实施例的优选实施方式中,所述获取一段预设时长的视频资料包括:

生成一启动信号启动摄像头,并将所述摄像头的使用模式调整为视频录制模式;

在显示屏上显示一段预设的文字,提示用户念所述预设的文字;及

控制所述摄像头录制视频,并于获取到一段预设时长的视频时生成一关闭信号关闭所述摄像头。

本发明的第二方面提供一种计算机装置,所述计算机装置包括处理器和存储器,所述存储器用于存储至少一个指令,所述处理器用于执行所述至少一个指令实现所述多重联合认证方法。

本发明的第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现所述多重联合认证方法。

本发明的第四方面提供一种多重联合认证装置,所述装置包括:

执行模块,用于获取一段预设时长的视频资料;

验证模块,用于从所述视频资料获取N帧图像,其中,N为正整数;

所述验证模块,还用于计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像,其中,所述目标图像的清晰度最高;

所述验证模块,还用于当所述目标图像的清晰度小于预设值时,增强所述目标图像的清晰度;

所述验证模块,还用于从所述目标图像中提取出用户的生物特征;及

所述验证模块,还用于根据所提取的生物特征与预先存储的生物特征是否相匹配确定用户是否通过第一次身份验证;

所述执行模块,还用于当用户通过所述第一次身份验证时,将所获取的视频资料转化为音频资料;

所述执行模块,还用于从所述音频资料中提取出用户的身份特征;

所述验证模块,还用于将所提取出的用户的身份特征与预定的身份特征进行比较以对用户进行第二次身份验证;及

若所提取出的用户的身份特征与预定的身份特征相匹配,所述验证模块则确定用户通过所述第二次身份验证;若所提取出的用户的身份特征与预定的身份特征不匹配,所述验证模块则确定用户没有通过所述第二次身份验证。

本发明实施例中所述的多重联合认证方法、装置、计算机装置及存储介质,通过获取一段预设时长的视频资料;从所述视频资料获取N帧图像,其中,N为正整数;计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像,其中,所述目标图像的清晰度最高;当所述目标图像的清晰度小于预设值时,增强所述目标图像的清晰度;从所述目标图像中提取出用户的生物特征;及根据所提取的生物特征与预先存储的生物特征是否相匹配确定用户是否通过第一次身份验证;当用户通过所述第一次身份验证时,将所获取的视频资料转化为音频资料;从所述音频资料中提取出用户的身份特征;将所提取出的用户的身份特征与预定的身份特征进行比较以对用户进行第二次身份验证;及若所提取出的用户的身份特征与预定的身份特征相匹配,则确定用户通过所述第二次身份验证;若所提取出的用户的身份特征与预定的身份特征不匹配,则确定用户没有通过所述第二次身份验证,可解决认证效率低下技术问题的同时加强认证的有效性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1是本发明实施例一提供的多重联合认证方法的流程图。

图2是本发明实施例二提供的多重联合认证装置的结构图。

图3是本发明实施例三提供的计算机装置的示意图。

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。

实施例一

图1是本发明实施例一提供的多重联合认证方法的流程图。

在本实施例中,所述多重联合认证方法可以应用于计算机装置中,对于需要进行多重联合认证的计算机装置,可以直接在计算机装置上集成本发明的方法所提供的用于多重联合认证的功能,或者以软件开发工具包(Software Development Kit,SDK)的形式运行在计算机装置上。

如图1所示,所述多重联合认证方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。

步骤S1、计算机装置获取一段预设时长的视频资料。

在一个实施例中,所述获取一段预设时长的视频资料包括步骤(a1)-(a3):

步骤(a1)、生成一启动信号启动所述计算机装置的摄像头,并将所述摄像头的使用模式调整为视频录制模式。

在一个实施例中,计算机装置可以于任何装置或系统需要进行用户身份验证时生成所述启动信号。在其他实施例中,也可以于响应于用户的输入来生成所述启动信号。

在一个实施例中,所述将所述摄像头的使用模式调整为视频录制模式包括步骤(a11)-(a12):

步骤(a11)、于启动所述摄像头后,判断所述摄像头的当前的使用模式是否为视频录制模式。

步骤(a12)、若所述摄像头的当前的使用模式不是视频录制模式,则生成一调整信号将所述摄像头的使用模式调整为视频录制模式。若所述摄像头的当前的使用模式是视频录制模式,则保持所述视频录制模式。即无需对所述摄像头的使用模式进行调整。

需要说明的是,一般来讲,摄像头开启后的默认的使用模式为拍照模式。因此,需要将所述摄像头的使用模式从拍照模式切换到视频录制模式。当然,若所述摄像头的默认的使用模式为视频录制模式则无需对所述摄像头的使用模式做调整。

步骤(a2)、在所述计算机装置的显示屏上显示一段预设的文字,提示用户念所述预设的文字。

步骤(a3)、控制所述摄像头录制视频,并于获取到一段预设时长的视频时生成一关闭信号关闭所述摄像头。

在其他实施例中,所述计算机装置也可以从其他计算机装置获取所述预设时长的视频资料。即所述预设时长的视频资料为其他计算机装置所录制并发送到所述计算机装置的。

步骤S2、计算机装置基于所获取的视频资料对用户进行第一次身份验证。

若用户通过所述第一次身份验证,执行步骤S3。若用户没有通过所述第一次身份验证,回到步骤S1。

在一个实施例中,所述基于所获取的视频资料对用户进行第一次身份验证包括步骤(b1)-(b5):

步骤(b1)、从所述视频资料获取N帧图像,其中,N为正整数。例如N可以等于2、3、4,或者其他值。

步骤(b2)、计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像,其中,所述目标图像的清晰度最高。

在本实施方式中,可以通过灰度变化函数、梯度函数、或者图像灰度熵函数等计算每帧图像的清晰度。

步骤(b3)、确定所述目标图像的清晰度是否大于一个预设值,并当所述目标图像的清晰度小于所述预设值时,增强所述目标图像的清晰度。

在一个实施例中,所述增强所述目标图像的清晰度包括步骤(b31)-(b33):

(b31):计算所述目标图像中的高频分量和低频分量。

具体地,通过对所述目标图像的空域信号进行低通滤波后得到所述目标图像的低频分量,对所述目标图像的空域信号进行差值运算后得到所述目标图像的高频分量。

(b32):对所述目标图像中的高频分量进行分类,并对分类后的高频分量进行增强处理。

具体地,通过对所述目标图像的高频分量识别后进行分类,分出所述高频分量中的噪声、细节、小边缘和大边缘,再分别对所述高频分量中的噪声、细节、小边缘和大边缘进行增强处理。

所述对分类后的高频分量进行增强处理包括步骤(b321)-(b323):

(b321):计算核化降噪动态阈值,判断所述目标图像中的点是否属于噪声。

通过将所述目标图像中的点的高频分量的绝对值与所述核化降噪动态阈值进行比对,来判断所述目标图像中的点是否属于噪声;若所述目标图像中的点的高频分量的绝对值小于所述核化降噪阈值,则确认该点为噪声,执行步骤b322;若所述目标图像中的点的高频分量的绝对值大于或等于所述核化降噪阈值,则确认该点不是噪声,执行步骤b323。

(b322):将该点对应的高频分量的值设置为0。通过将该点对应的高频分量的值设置为0以抑制掉小幅高频噪声,达到核化降噪的目的。

(b323):应用非线性高频增强曲线对所述目标图像的高频分量进行增强。

通过所述非线性高频增强曲线处理后可以对所述高频分量中的细节、小边缘和大边缘对应的不同区域段进行不同程度的处理,由此得到的增强图像,过渡平滑自然,且保持了高频分量的单调性。

(b33):将增强后的高频分量与所述低频分量叠加得到新的目标图像。

另外还需要说明的是,本案通过对所述目标图像的清晰度进行增强处理,可以提高认证效率。有效避免了因用户所处环境光线不足或摄像头分辨率低等原因造成所获取的视频图像的清晰度不够而影响用户生物特征提取,进而影响认证结果的技术问题。

步骤(b4)、从所述目标图像中提取出用户的生物特征,其中,所述生物特征包括,但不限于,人脸特征、虹膜特征。

需要说明的是,若在步骤b3中对所述目标图像的清晰度进行了增强处理,则本步骤中是从所述做了清晰度增强处理后的所述目标图像中提取生物特征。

在一个实施例中,可采用MTCNN(Multi-task Cascaded Convolutional Networks)算法从所述目标图像中检测出人脸部分,并可采用FaceNet人工神经网络从所检测出的人脸部分中提取人脸特征。在一个实施例中,可采用虹膜识别技术从所述目标图像中提取出用户的虹膜特征。

步骤(b5)、根据所提取的生物特征与预先存储的生物特征是否相匹配来确定用户是否通过第一次身份验证。

具体地,当所提取的生物特征与预先存储的生物特征相匹配时,确定用户通过所述第一次身份验证。具体地,当所提取的人脸特征与预先存储的人脸特征相匹配且所述提取的虹膜特征与预先存储的虹膜特征相匹配时,则确定用户通过所述第一次身验证。

步骤S3、当用户通过第一次身份验证时,计算机装置将所获取的视频资料转化为音频资料。

在一个实施例中,计算机装置可以利用音视频转码工具(例如Tipard Video Converter等)将所获取的视频资料转化为音频资料。

在一个实施例中,所述音频资料所对应的时长等于所述视频资料所对应的时长。

步骤S4、计算机装置从所述音频资料中提取出用户的身份特征。

在一个实施例中,所述用户的身份特征包括,但不限于,用户的声纹、语速、情绪。

在一个实施例中,计算机装置可以利用现有的任何声纹识别算法从所述音频资料中提取出用户的声纹。

所述声纹识别算法可以是为模板匹配法、高斯混合模型(GMM)、高斯混合背景模型(GMM-UBM)及支持向量机(GMM-SVM)、联合因子分析(Joint Factor Analysis,JFA)、基于深度神经网络(DNN)的iVector方法、端到端(End to End)深度神经网络。

在第一实施例中,用户的语速可以定义为用户在单位时长内所念的文字个数。计算机装置从所述音频资料中获取用户的语速包括步骤(c1)-(c3):

步骤(c1)、利用语音识别算法识别所述音频资料所对应的文字。

步骤(c2)、统计所识别获得的文字的总数N。

步骤(c3)、将所述总数N除以所述音频资料所对应的时长获得所述用户的语速。

在一个实施例中,所述音频资料所对应的时长也即是播放所述音频资料所需要的时间。

在第二实施例中,用户的语速可以定义为用户在单位时长内所念出的音节个数。计算机装置从所述音频资料中获取用户的语速包括步骤(d1)-(d4):

步骤(d1)、将所述音频资料切分为M帧音频。

在一个实施例中,每帧音频的播放时长为T。

在一个实施例中,M可以为大于等于1的正整数,例如M可以等于1、2、3、4,或者其他数值。T可以等于2秒、3秒,或者其他数值。

步骤(d2)、利用预设的音节识别器识别所述M帧音频中的每帧音频所包括的音节。

步骤(d3)、统计所述M帧音频中的每帧音频所包括的音节的数目,将每帧音频所包括的音节的数目进行加总获得所述M帧音频所包括的音节的总数S。

步骤(d4)、将所述总数S除以所述音频资料所对应的时长获得所述用户的语速。

在一个实施例中,计算机装置可以首先从所述音频资料中识别用户的音调、声音的大小,根据用户的音调、声音的大小来确定用户的情绪。

在其他实施例中,计算机装置也可以根据利用现有的情绪识别算法来识别用户的情绪。

步骤S5、计算机装置将所提取出用户的身份特征与预定的身份特征进行比较以对用户进行第二次身份验证。若所提取出用户的身份特征与预定的身份特征相匹配,则确定用户通过所述第二次身份验证。若所提取出用户的身份特征与预定的身份特征不匹配,则确定用户没有通过所述第二次身份验证。

在第一实施例中,当所提取的用户的声纹与预设的声纹相匹配时,确定用户通过所述第二次身份验证。当所提取的用户的声纹与预设的声纹不匹配时,确定用户没有通过所述第二次身份验证。

在第二实施例中,当所提取的用户的声纹与预设的声纹相匹配,且所提取的用户的语速达到预设的语速时,确定用户通过所述第二次身份验证。当所提取的用户的声纹与预设的声纹不匹配及/或所提取的用户的语速没有达到预设的语速时,确定用户没有通过所述第二次身份验证。

在第三实施例中,当所提取的用户的声纹与预设的声纹相匹配,且所提取的用户的语速达到预设的语速,且所提取的用户的情绪与预定的情绪相匹配,确定用户通过所述第二次身份验证。当所提取的用户的声纹与预设的声纹不匹配,及/或所提取的用户的语速没有达到预设的语速,及/或所提取的用户的情绪与预定的情绪不匹配,确定用户没有通过所述第二次身份验证。

综上所述,本发明实施例中所述的多重联合认证方法,通过获取一段预设时长的视频资料;从所述视频资料获取N帧图像,其中,N为正整数;计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像,其中,所述目标图像的清晰度最高;当所述目标图像的清晰度小于预设值时,增强所述目标图像的清晰度;从所述目标图像中提取出用户的生物特征;及根据所提取的生物特征与预先存储的生物特征是否相匹配确定用户是否通过第一次身份验证;当用户通过所述第一次身份验证时,将所获取的视频资料转化为音频资料;从所述音频资料中提取出用户的身份特征;将所提取出的用户的身份特征与预定的身份特征进行比较以对用户进行第二次身份验证;及若所提取出的用户的身份特征与预定的身份特征相匹配,则确定用户通过所述第二次身份验证;若所提取出的用户的身份特征与预定的身份特征不匹配,则确定用户没有通过所述第二次身份验证,可解决认证效率低下技术问题的同时加强认证的有效性。

上述图1详细介绍了本发明的多重联合认证方法,下面结合图2和图3,对实现所述多重联合认证方法的软件装置的功能模块以及实现所述多重联合认证方法的硬件装置架构进行介绍。

应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。

实施例二

参阅图2所示,是本发明实施例二提供的多重联合认证装置的结构图。

在一些实施例中,所述多重联合认证装置30运行于计算机装置中。所述计算机装置通过网络连接了外部设备。所述多重联合认证装置30可以包括多个由程序代码段所组成的功能模块。所述多重联合认证装置30中的各个程序段的程序代码可以存储于计算机装置的存储器中,并由所述至少一个处理器所执行,以实现(详见图2描述)多重联合认证功能。

本实施例中,所述多重联合认证装置30根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:执行模块301、验证模块302。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。

执行模块301获取一段预设时长的视频资料。

在一个实施例中,所述获取一段预设时长的视频资料包括步骤(a1)-(a3):

步骤(a1)、生成一启动信号启动所述计算机装置的摄像头,并将所述摄像头的使用模式调整为视频录制模式。

在一个实施例中,执行模块301可以于任何装置或系统需要进行用户身份验证时生成所述启动信号。在其他实施例中,也可以于响应于用户的输入来生成所述启动信号。

在一个实施例中,所述将所述摄像头的使用模式调整为视频录制模式包括步骤(a11)-(a12):

步骤(a11)、于启动所述摄像头后,判断所述摄像头的当前的使用模式是否为视频录制模式。

步骤(a12)、若所述摄像头的当前的使用模式不是视频录制模式,则生成一调整信号将所述摄像头的使用模式调整为视频录制模式。若所述摄像头的当前的使用模式是视频录制模式,则保持所述视频录制模式。即无需对所述摄像头的使用模式进行调整。

需要说明的是,一般来讲,摄像头开启后的默认的使用模式为拍照模式。因此,需要将所述摄像头的使用模式从拍照模式切换到视频录制模式。当然,若所述摄像头的默认的使用模式为视频录制模式则无需对所述摄像头的使用模式做调整。

步骤(a2)、在所述计算机装置的显示屏上显示一段预设的文字,提示用户念所述预设的文字。

步骤(a3)、控制所述摄像头录制视频,并于获取到一段预设时长的视频时生成一关闭信号关闭所述摄像头。

在其他实施例中,所述执行模块301也可以从其他计算机装置获取所述预设时长的视频资料。即所述预设时长的视频资料为其他计算机装置所录制并发送到所述计算机装置的。

验证模块302基于所获取的视频资料对用户进行第一次身份验证。

在一个实施例中,所述基于所获取的视频资料对用户进行第一次身份验证包括步骤(b1)-(b5):

步骤(b1)、从所述视频资料获取N帧图像,其中,N为正整数。例如N可以等于2、3、4,或者其他值。

步骤(b2)、计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像,其中,所述目标图像的清晰度最高。

在本实施方式中,可以通过灰度变化函数、梯度函数、或者图像灰度熵函数等计算每帧图像的清晰度。

步骤(b3)、确定所述目标图像的清晰度是否大于一个预设值,并当所述目标图像的清晰度小于所述预设值时,增强所述目标图像的清晰度。

在一个实施例中,所述增强所述目标图像的清晰度包括步骤(b31)-(b33):

(b31):计算所述目标图像中的高频分量和低频分量。

具体地,通过对所述目标图像的空域信号进行低通滤波后得到所述目标图像的低频分量,对所述目标图像的空域信号进行差值运算后得到所述目标图像的高频分量。

(b32):对所述目标图像中的高频分量进行分类,并分类后的高频分量进行增强处理。

具体地,通过对所述目标图像的高频分量进行分类,分出所述高频分量中的噪声、细节、小边缘和大边缘,再分别对所述高频分量中的噪声、细节、小边缘和大边缘进行增强处理。

所述对分类后的高频分量进行增强处理包括步骤(b321)-(b323):

(b321):计算核化降噪动态阈值,判断所述目标图像中的点是否属于噪声。

通过将所述目标图像中的点的高频分量的绝对值与所述核化降噪动态阈值进行比对,来判断所述目标图像中的点是否属于噪声;若所述目标图像中的点的高频分量的绝对值小于所述核化降噪阈值,则确认该点为噪声,执行步骤b322;若所述目标图像中的点的高频分量的绝对值大于或等于所述核化降噪阈值,则确认该点不是噪声,执行步骤b323。

(b322):将该点对应的高频分量的值设置为0。通过将该点对应的高频分量的值设置为0以抑制掉小幅高频噪声,达到核化降噪的目的。

(b323):应用非线性高频增强曲线对所述目标图像的高频分量进行增强。

通过所述非线性高频增强曲线处理后可以对所述高频分量中的细节、小边缘和大边缘对应的不同区域段进行不同程度的处理,由此得到的增强图像,过渡平滑自然,且保持了高频分量的单调性。

(b33):将增强后的高频分量与所述低频分量叠加得到新的目标图像。

另外还需要说明的是,本案通过对所述目标图像的清晰度进行增强处理,可以提高认证效率。有效避免了因用户所处环境光线不足或摄像头分辨率低等原因造成所获取的视频图像的清晰度不够而影响用户生物特征提取,进而影响认证结果的技术问题。

步骤(b4)、从所述目标图像中提取出用户的生物特征,其中,所述生物特征包括,但不限于,人脸特征、虹膜特征。

需要说明的是,若对所述目标图像的清晰度进行了增强处理,则本步骤(b4)中是从所述做了清晰度增强处理后的所述目标图像中提取生物特征。

在一个实施例中,可采用MTCNN(Multi-task Cascaded Convolutional Networks)算法从所述目标图像中检测出人脸部分,并可采用FaceNet人工神经网络从所检测出的人脸部分中提取人脸特征。在一个实施例中,可采用虹膜识别技术从所述目标图像中提取出用户的虹膜特征。

步骤(b5)、根据所提取的生物特征与预先存储的生物特征是否相匹配来确定用户是否通过第一次身份验证。

具体地,当所提取的生物特征与预先存储的生物特征相匹配时,验证模块302确定用户通过所述第一次身份验证。具体地,当所提取的人脸特征与预先存储的人脸特征相匹配且所述提取的虹膜特征与预先存储的虹膜特征相匹配时,验证模块302则确定用户通过所述第一次身验证。

当用户通过所述第一次身验证时,执行模块301将所获取的视频资料转化为音频资料。

在一个实施例中,执行模块301可以利用音视频转码工具(例如Tipard Video Converter等)将所获取的视频资料转化为音频资料。

在一个实施例中,所述音频资料所对应的时长等于所述视频资料所对应的时长。

执行模块301从所述音频资料中提取出用户的身份特征。

在一个实施例中,所述用户的身份特征包括,但不限于,用户的声纹、语速、情绪。

在一个实施例中,计执行模块301可以利用现有的任何声纹识别算法从所述音频资料中提取出用户的声纹。

所述声纹识别算法可以是为模板匹配法、高斯混合模型(GMM)、高斯混合背景模型(GMM-UBM)及支持向量机(GMM-SVM)、联合因子分析(Joint Factor Analysis,JFA)、基于深度神经网络(DNN)的iVector方法、端到端(End to End)深度神经网络。

在第一实施例中,用户的语速可以定义为用户在单位时长内所念的文字个数。执行模块301从所述音频资料中获取用户的语速包括步骤(c1)-(c3):

步骤(c1)、利用语音识别算法识别所述音频资料所对应的文字。

步骤(c2)、统计所识别获得的文字的总数N。

步骤(c3)、将所述总数N除以所述音频资料所对应的时长获得所述用户的语速。

在一个实施例中,所述音频资料所对应的时长也即是播放所述音频资料所需要的时间。

在第二实施例中,用户的语速可以定义为用户在单位时长内所念出的音节个数。执行模块301从所述音频资料中获取用户的语速包括步骤(d1)-(d4):

步骤(d1)、将所述音频资料切分为M帧音频。

在一个实施例中,每帧音频的播放时长为T。

在一个实施例中,M可以为大于等于1的正整数,例如M可以等于1、2、3、4,或者其他数值。T可以等于2秒、3秒,或者其他数值。

步骤(d2)、利用预设的音节识别器识别所述M帧音频中的每帧音频所包括的音节。

步骤(d3)、统计所述M帧音频中的每帧音频所包括的音节的数目,将每帧音频所包括的音节的数目进行加总获得所述M帧音频所包括的音节的总数S。

步骤(d4)、将所述总数S除以所述音频资料所对应的时长获得所述用户的语速。

在一个实施例中,执行模块301可以首先从所述音频资料中识别用户的音调、声音的大小,根据用户的音调、声音的大小来确定用户的情绪。

在其他实施例中,执行模块301也可以根据利用现有的情绪识别算法来识别用户的情绪。

验证模块302将所提取出用户的身份特征与预定的身份特征进行比较以对用户进行第二次身份验证。若所提取出用户的身份特征与预定的身份特征相匹配,验证模块302则确定用户通过所述第二次身份验证。若所提取出用户的身份特征与预定的身份特征不匹配,验证模块302则确定用户没有通过所述第二次身份验证。

在第一实施例中,当所提取的用户的声纹与预设的声纹相匹配时,验证模块302确定用户通过所述第二次身份验证。当所提取的用户的声纹与预设的声纹不匹配时,验证模块302确定用户没有通过所述第二次身份验证。

在第二实施例中,当所提取的用户的声纹与预设的声纹相匹配,且所提取的用户的语速达到预设的语速时,验证模块302确定用户通过所述第二次身份验证。当所提取的用户的声纹与预设的声纹不匹配及/或所提取的用户的语速没有达到预设的语速时,验证模块302确定用户没有通过所述第二次身份验证。

在第三实施例中,当所提取的用户的声纹与预设的声纹相匹配,且所提取的用户的语速达到预设的语速,且所提取的用户的情绪与预定的情绪相匹配,验证模块302确定用户通过所述第二次身份验证。当所提取的用户的声纹与预设的声纹不匹配,及/或所提取的用户的语速没有达到预设的语速,及/或所提取的用户的情绪与预定的情绪不匹配,验证模块302确定用户没有通过所述第二次身份验证。

综上所述,本发明实施例中所述的多重联合认证装置,通过获取一段预设时长的视频资料;从所述视频资料获取N帧图像,其中,N为正整数;计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像,其中,所述目标图像的清晰度最高;当所述目标图像的清晰度小于预设值时,增强所述目标图像的清晰度;从所述目标图像中提取出用户的生物特征;及根据所提取的生物特征与预先存储的生物特征是否相匹配确定用户是否通过第一次身份验证;当用户通过所述第一次身份验证时,将所获取的视频资料转化为音频资料;从所述音频资料中提取出用户的身份特征;将所提取出的用户的身份特征与预定的身份特征进行比较以对用户进行第二次身份验证;及若所提取出的用户的身份特征与预定的身份特征相匹配,则确定用户通过所述第二次身份验证;若所提取出的用户的身份特征与预定的身份特征不匹配,则确定用户没有通过所述第二次身份验证,可解决认证效率低下技术问题的同时加强认证的有效性。

实施例三

参阅图3所示,为本发明实施例三提供的计算机装置的结构示意图。在本发明较佳实施例中,所述计算机装置3包括存储器31、至少一个处理器32、至少一条通信总线33。本领域技术人员应该了解,图3示出的计算机装置的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机装置3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。

在一些实施例中,所述计算机装置3包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的终端,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。

需要说明的是,所述计算机装置3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。

在一些实施例中,所述存储器31用于存储程序代码和各种数据,例如安装在所述计算机装置3中的多重联合认证装置30,并在计算机装置3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他存储介质。

在一些实施例中,所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述计算机装置3的控制核心(Control Unit),利用各种接口和线路连接整个计算机装置3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行计算机装置3的各种功能和处理数据,例如执行多重联合认证的功能。

在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。

尽管未示出,所述计算机装置3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机装置3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。

应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。

上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是服务器、个人电脑等)或处理器(processor)执行本发明各个实施例所述方法的部分。

在进一步的实施例中,结合图2,所述至少一个处理器32可执行所述计算机装置3的操作装置以及安装的各类应用程序(如所述的多重联合认证装置30)、程序代码等,例如,上述的各个模块。

所述存储器31中存储有程序代码,且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如,图2中所述的各个模块是存储在所述存储器31中的程序代码,并由所述至少一个处理器32所执行,从而实现所述各个模块的功能以达到多重联合认证的目的。

在本发明的一个实施例中,所述存储器31存储多个指令,所述多个指令被所述至少一个处理器32所执行以实现多重联合认证的目的。

具体地,所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

技术特征:

1.一种多重联合认证方法,其特征在于,所述方法包括:

获取一段预设时长的视频资料;

从所述视频资料获取N帧图像,其中,N为正整数;

计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像,其中,所述目标图像的清晰度最高;

当所述目标图像的清晰度小于预设值时,增强所述目标图像的清晰度;

从所述目标图像中提取出用户的生物特征;及

根据所提取的生物特征与预先存储的生物特征是否相匹配确定用户是否通过第一次身份验证;

当用户通过所述第一次身份验证时,将所获取的视频资料转化为音频资料;

从所述音频资料中提取出用户的身份特征;

将所提取出的用户的身份特征与预定的身份特征进行比较以对用户进行第二次身份验证;及

若所提取出的用户的身份特征与预定的身份特征相匹配,则确定用户通过所述第二次身份验证;若所提取出的用户的身份特征与预定的身份特征不匹配,则确定用户没有通过所述第二次身份验证。

2.如权利要求1所述的多重联合认证方法,其特征在于,所述增强所述目标图像的清晰度包括:

计算所述目标图像中的高频分量和低频分量;

对所述目标图像中的高频分量进行分类,并对分类后的高频分量进行增强处理;及

将增强后的高频分量与所述低频分量叠加得到新的目标图像。

3.如权利要求2所述的多重联合认证方法,其特征在于,所述对分类后的高频分量进行增强处理包括:

计算核化降噪动态阈值,判断所述目标图像中的点是否属于噪声;

若所述目标图像中的点属于噪声,将所述目标图像中的点对应的高频分量的值设置为0;

若所述目标图像中的点不属于噪声,应用非线性高频增强曲线对所述目标图像的高频分量进行增强。

4.如权利要求3所述的多重联合认证方法,其特征在于,所述判断所述目标图像中的点是否属于噪声包括:

将所述目标图像中的点的高频分量的绝对值与所述核化降噪动态阈值进行比对;

若所述目标图像中的点的高频分量的绝对值小于所述核化降噪阈值,则确认所述目标图像中的点为噪声;及

若所述目标图像中的点的高频分量的绝对值大于或等于所述核化降噪阈值,则确认所述目标图像中的点不是噪声。

5.如权利要求1所述的多重联合认证方法,其特征在于,所述用户的身份特征包括用户的语速,其中,所述用户的语速定义为用户在单位时长内所念的文字个数,从所述音频资料中获取用户的语速包括:

利用语音识别算法识别所述音频资料所对应的文字;

统计所识别获得的文字的总数N;及

将所述总数N除以所述音频资料所对应的时长获得所述用户的语速,其中,所述音频资料所对应的时长是指播放所述音频资料所需要的时间。

6.如权利要求1所述的多重联合认证方法,其特征在于,所述用户的身份特征包括用户的语速,其中,所述用户的语速定义为用户在单位时长内所念的文字个数,从所述音频资料中获取用户的语速包括:

将所述音频资料切分为M帧音频;

利用预设的音节识别器识别所述M帧音频中的每帧音频所包括的音节;

统计所述M帧音频中的每帧音频所包括的音节的数目,将每帧音频所包括的音节的数目进行加总获得所述M帧音频所包括的音节的总数S;及

将所述总数S除以所述音频资料所对应的时长获得所述用户的语速。

7.如权利要求1所述的多重联合认证方法,其特征在于,所述获取一段预设时长的视频资料包括:

生成一启动信号启动摄像头,并将所述摄像头的使用模式调整为视频录制模式;

在显示屏上显示一段预设的文字,提示用户念所述预设的文字;及

控制所述摄像头录制视频,并于获取到一段预设时长的视频时生成一关闭信号关闭所述摄像头。

8.一种计算机装置,其特征在于,所述计算机装置包括处理器和存储器,所述存储器用于存储至少一个指令,所述处理器用于执行所述至少一个指令实现如权利要求1至7中任意一项所述多重联合认证方法。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至7中任意一项所述多重联合认证方法。

10.一种多重联合认证装置,其特征在于,所述装置包括:

执行模块,用于获取一段预设时长的视频资料;

验证模块,用于从所述视频资料获取N帧图像,其中,N为正整数;

所述验证模块,还用于计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像,其中,所述目标图像的清晰度最高;

所述验证模块,还用于当所述目标图像的清晰度小于预设值时,增强所述目标图像的清晰度;

所述验证模块,还用于从所述目标图像中提取出用户的生物特征;及

所述验证模块,还用于根据所提取的生物特征与预先存储的生物特征是否相匹配确定用户是否通过第一次身份验证;

所述执行模块,还用于当用户通过所述第一次身份验证时,将所获取的视频资料转化为音频资料;

所述执行模块,还用于从所述音频资料中提取出用户的身份特征;

所述验证模块,还用于将所提取出的用户的身份特征与预定的身份特征进行比较以对用户进行第二次身份验证;及

若所提取出的用户的身份特征与预定的身份特征相匹配,所述验证模块则确定用户通过所述第二次身份验证;若所提取出的用户的身份特征与预定的身份特征不匹配,所述验证模块则确定用户没有通过所述第二次身份验证。

技术总结

本发明提供一种多重联合认证方法,包括从视频资料获取N帧图像;计算所述N帧图像中的每帧图像的清晰度,根据每帧图像的清晰度从所述N帧图像中确定一张目标图像;当所述目标图像的清晰度小于预设值时,增强所述目标图像的清晰度;从所述目标图像中提取出用户的生物特征;及根据所提取的生物特征确定用户是否通过所述第一次身份验证;以及当用户通过所述第一次身份验证时,将所述视频资料转化为音频资料,并基于所述音频资料进行第二次身份验证。本发明还提供实现所述多重联合认证方法的装置、计算机装置及存储介质。本发明可解决视频认证效率低下的技术问题。

技术研发人员:齐燕

受保护的技术使用者:深圳壹账通智能科技有限公司

技术研发日:.04.18

技术公布日:.09.10

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。