100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 数据检测方法 装置 电子设备以及存储介质与流程

数据检测方法 装置 电子设备以及存储介质与流程

时间:2021-08-07 01:22:43

相关推荐

数据检测方法 装置 电子设备以及存储介质与流程

本发明涉及计算机技术领域,具体涉及一种数据检测方法、装置、电子设备以及存储介质。

背景技术:

随着通信技术的发展,数据安全也越来越受到人们的重视,以企业数据安全为例,为了防止不法分子获取到企业的一些数据来谋取利润,通常会对数据进行检测,目前,常用的检测方案可以基于规则的异常检测方案以及基于传统机器学习的异常检测方案。

上述提到的方案中都要求有充足的数据作为支撑,才能进行全局范围内的异常检测,从而发现真正的异常,然而,受限于信息孤岛的原因在数据量不够的情况下仍然使用异常检测算法,可能会导致检测结果不准确。

技术实现要素:

本发明实施例提供一种数据检测方法、装置、电子设备以及存储介质,可以提高数据检测的准确率。

本发明实施例提供了一种数据检测方法,包括:

通过预设同态加密算法对待检测数据进行加密,得到加密后数据;

将所述加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密后数据进行聚类处理;

接收服务器返回的第一聚类结果,采用所述同态加密算法对第一聚类结果进行解密;

根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值;

获取所述目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

相应的,本发明实施例还提供了一种数据检测装置,包括:

加密模块,用于通过预设同态加密算法对待检测数据进行加密,得到加密后数据;

发送模块,用于将所述加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密后数据进行聚类处理;

解密模块,用于接收服务器返回的第一聚类结果,并采用所述同态加密算法对第一聚类结果进行解密;

确定模块,用于根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值;

获取模块,用于获取所述目标聚类中心对应的范围区间值;

检测模块,用于通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

可选的,在本发明的一些实施例中,所述检测模块包括:

提取单元,用于提取解密后的聚类结果中所有的聚类中心;

计算单元,用于计算所述目标聚类中心与各聚类中心之间的距离;

检测单元,用于基于隶属度值、范围区间值以及距离对待检测数据进行检测,得到待检测数据对应的检测结果。

可选的,在本发明的一些实施例中,所述检测单元具体用于:

在所述距离小于等于第一阈值时,判断目标隶属度值是否位于目标聚类中心的范围区间值内,若目标隶属度值位于目标聚类中心的范围区间值内,则确定待检测对象为正常数据。

可选的,在本发明的一些实施例中,所述检测单元具体还用于:

当目标聚类中心与其他聚类中心之间的距离大于第一阈值时,将待检测对象确定为异常数据,或者;

当目标聚类中心与其他聚类中心之间的距离小于等于第一阈值,且目标隶属度值不位于目标聚类中心的范围区间值内时,将待检测对象确定为异常数据。

可选的,在本发明的一些实施例中,还包括训练模块,所述训练模块具体用于:

获取样本数据集,所述样本数据集包括多个数据情况标注为正常的样本数据;

通过预设同态加密算法对所述样本数据集的样本数据进行加密,得到加密数据集;

将所述加密数据集发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密数据集中的数据进行聚类处理;

接收服务器返回的第二聚类结果,采用所述同态加密算法对第二聚类结果进行解密;

根据解密后的第二聚类结果确定样本数据所属聚类的聚类中心以及样本数据对应的隶属度值;

根据样本数据对应的隶属度值,计算样本数据所属聚类的聚类中心的范围区间值;

通过样本数据对应的隶属度值、样本数据所属聚类的聚类中心以及样本数据所属聚类的聚类中心的范围区间值对样本数据的数据情况进行预测,得到样本数据的预测数据情况;

根据真实数据情况和预测数据情况,对样本数据所属聚类的聚类中心进行调整,直到样本数据所属聚类的聚类中心满足预设条件完毕;

保存满足预设条件的聚类中心对应的范围区间值;

所述获取模块具体用于从保存的范围区间值中获取所述目标聚类中心对应的范围区间值。

可选的,在本发明的一些实施例中,还包括构建模块,所述构建模块具体用于:

提取样本数据对应的聚类中心的属性信息;

构建属性信息与范围区间值之间的映射关系。

可选的,在本发明的一些实施例中,所述确定模块具体用于:

提取所述目标聚类中心对应的属性信息;

基于预设映射关系,从保存的范围区间值中获取所述目标聚类中心对应的范围区间值。

可选的,在本发明的一些实施例中,所述解密模块具体用于:

基于预设同态加密算法,获取待检测数据对应的解密函数;

通过解密函数对第一聚类结果进行解密处理。

本发明实施例在通过预设同态加密算法对待检测数据进行加密,得到加密后数据后,将所述加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密后数据进行聚类处理,然后,接收服务器返回的第一聚类结果,采用所述同态加密算法对第一聚类结果进行解密,接着,根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,最后,获取所述目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。因此,该方案可以有效地数据检测的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1a是本发明实施例提供的数据检测方法的场景示意图;

图1b是本发明实施例提供的数据检测方法的流程示意图;

图2a是本发明实施例提供的数据检测方法的另一流程示意图;

图2b是本发明实施例提供的映射关系的示意图

图2c是本发明实施例提供的数据检测方法的另一场景示意图;

图2d是本发明实施例提供的检测结果的界面示意图;

图3a是本发明实施例提供的数据检测装置的第一种实施方式的结构示意图;

图3b是本发明实施例提供的数据检测装置的第二种实施方式的结构示意图;

图3c是本发明实施例提供的数据检测装置的第三种实施方式的结构示意图;

图4是本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供一种数据检测系统,以下简称检测系统。

其中,该检测系统可以包括用户、终端以及服务器,该数据检测装置具体可以集成在终端中,终端可以包括手机、平板电脑或个人计算机(pc,personalcomputer)。

例如,请参阅图1a,该数据检测装置集成在个人计算机上,个人计算机当接收到用户触发的数据检测指令时,计算机可以获取数据检测指令对应的待检测数据,然后,通过预设同态加密算法对待检测数据进行加密,得到加密后数据,并将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密后数据进行聚类处理,接着,个人计算机接收服务器返回的第一聚类结果,并采用同态加密算法对第一聚类结果进行解密,再然后,根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,最后,获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

由于该方案是通过同态加密算法对待检测数据进行加密,服务器无法获取到待检测数据的具体数值,因此,提高了数据检测的安全性;另外,服务器可以基于从不同终端获取到的数据对加密后数据进行聚类处理,解决了目前的数据检测方案受限于数据孤岛而导致因数据量过少带来的误报,进而提高数据检测的准确性。

以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优先顺序的限定。

一种数据检测方法,包括:通过预设同态加密算法对待检测数据进行加密,得到加密后数据,将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理,接收服务器返回的第一聚类结果,采用同态加密算法对第一聚类结果进行解密,根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

请参阅图1b,图1b为本发明实施例提供的数据检测方法的流程示意图。该数据检测方法的具体流程可以如下:

101、通过预设同态加密算法对待检测数据进行加密,得到加密后数据。

具体的,可以从本地数据库中获取需要检测的待检测数据,然后,通过预设同态加密算法对待检测数据进行加密,得到加密后数据。

其中,同态加密是一种加密方法,它允许对数据执行数学运算,而不是对实际数据本身执行。密文是输入数据的加密版本,也称为纯文本,对密文进行操作然后解密以获得所需的输出。同态加密的关键是,从解密操作的密文中获得相同的输出,而不是简单地操作初始纯文本。也就是说,同态加密是一种无须对加密数据进行提前解密就可以执行计算的方法,使用同态加密技术在原数据上进行加密,不会对原数据的属性造成任何重大的改变。

可选的,本发明实施例可以采用轻量级同态加密算法。轻量级同态加密算法包括加法、减法和乘法,轻量级同态加密算法不仅可以保证各数据源的隐私以及扩大待检测数据的规模,同时还可以减小所占用的终端的内存,进而提高数据检测的效率。

102、将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理。

由于加密后数据是通过预设同态加密算法加密后的待检测数据,因此,服务器无法获取到待检测数据的真实值,并且,服务器可以获取不同终端的数据,这些数据也可以是经过加密处理的数据,然后,服务器基于这些数据对加密后数据进行聚类处理,这样可以减小由于终端的数据量不足而带来的误报,进而提高数据检测的准确性。

此外,服务器可以采用模糊聚类算法(fuzzyc-means,fcm)对加密后数据进行聚类处理,当然,也可以采用k均值聚类算法(k-meansclusteringalgorithm),在此,介绍一下模糊这个概念,所谓模糊是指这个概念的外延具有不确定性,或者说它的外延是不清晰的。比如“年轻”这个概念,它的内涵我们是知道的,但是它的外延,即什么年龄段内的人符合年轻,是很难说清楚的,因为“年轻”跟“不年轻”之间没有一个确定的边界,这就是模糊的概念。有人认为20岁就是“年轻”,那么21岁按照确定性的规划就属于“不年轻”。但是,也有人认为20岁和21岁同样都属于“年轻”的范畴,还有人认为21岁有0.9分像年轻,0.1分像不年轻,这里的0.9跟0.1指的是一种相似的程度。把这种一个样本属于结果的这种相似的程度称为样本的隶属度,表示一个样本相似于不同结果的一个程度指标。

103、接收服务器返回的第一聚类结果,采用同态加密算法对第一聚类结果进行解密。

由于服务器返回的第一聚类结果是加密后数据对应的聚类结果,因此,需要采用同态加密算法对第一聚类结果进行解密,比如,可以根据同态加密算法获取到相应的解密函数,然后,通过该解密函数对第一聚类结果进行解密,即,在一些实施例中,步骤“采用同态加密算法对第一聚类结果进行解密”,包括:

(11)基于预设同态加密算法,获取待检测数据对应的解密函数;

(12)通过解密秘钥对第一聚类结果进行解密处理。

比如,通过加密函数f对待检测数据a进行加密,得到加密后数据a’,也就是说f(a)=a’,因此,可以获取与该加密函数f对应的解密函数f-1,然后,可以通过这个解密函数f-1对第一聚类结果进行解密。需要说明的是,对于一般的加密函数而言,如果将加密后数据d’与加密后数据e’相加,得到叠加后的加密数据h’,此时,用解密函数f-1对h’进行解密,得到的结果一般是无意义的乱码,但是,如果加密函数f是可以进行同态加密的加密函数,此时,通过解密函数f-1对h’进行解密,得到解密结果h,此时,h=d+e,这样数据处理权与数据所有权可以分离,对于企业而言,可以防止自身数据泄露的同时,利用云服务的计算能力对自身数据进行处理。

需要说明的是,同态加密算法中的加密函数可以分为加法同态和乘法同态,如果f(a)+f(b)=f(a+b),这种加密函数叫做加法同态;如果f(a)×f(b)=f(a×b),这种加密函数叫做乘法同态;如果一个加密函数同时满足加法同态和乘法同态,称为全同态加密。

104、根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值。

可以从解密后的第一聚类结果提取待检测数据所属聚类的目标聚类中心,以及从解密后的第一聚类结果提取待检测数据属于该目标聚类中心的隶属度值。

在此,介绍一下隶属度值的概念,隶属度属于模糊评价函数里的概念,对论域u中的任一元素x,都有一个数a(x)∈(0,1)与之对应,则称a为u上的模糊集,a(x)称为x对a的隶属度值。隶属度a(x)越接近于1,表示x属于a的程度越高,a(x)越接近于0表示x属于a的程度越低。用取值于区间(0,1)的隶属函数a(x)表征x属于a的程度高低。

105、获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

其中,可以预先获取服务器基于多个数据,计算得到目标聚类中心对应的范围区间值,即,在一些实施例中,步骤“获取目标聚类中心对应的范围区间值”,具体可以包括:

(21)获取样本数据集,样本数据集包括多个数据情况标注为正常的样本数据;

(22)通过预设同态加密算法对样本数据集的样本数据进行加密,得到加密数据集;

(23)将加密数据集发送至服务器,以便服务器基于从不同终端获取到的数据对加密数据集中的数据进行聚类处理;

(24)接收服务器返回的第二聚类结果,采用同态加密算法对第二聚类结果进行解密;

(25)根据解密后的第二聚类结果确定样本数据所属聚类的聚类中心以及样本数据对应的隶属度值;

(26)根据样本数据对应的隶属度值,计算样本数据所属聚类的聚类中心的范围区间值;

(27)通过样本数据对应的隶属度值、样本数据所属聚类的聚类中心以及样本数据所属聚类的聚类中心的范围区间值对样本数据的数据情况进行预测,得到样本数据的预测数据情况;

(28)根据真实数据情况和预测数据情况,对样本数据所属聚类的聚类中心进行调整,直到样本数据所属聚类的聚类中心满足预设条件完毕;

(29)保存满足预设条件的聚类中心对应的范围区间值;

比如,可以获取一个样本数据集,该样本数据集包括10个样本数据,且这10个样本数据的数据情况均标注为正常,然后,通过同态加密算法分别对这10个样本数据进行加密,得到加密数据集,并将该数据加密集发送至服务器,以便服务器可以基于从不同终端获取到的数据对加密数据集中的数据进行聚类处理,接着,接收服务器返回的第二聚类结果,并采用同态加密算法对第二聚类结果进行解密,解密后的第二聚类结果中可以包括样本数据所属聚类的聚类中心以及样本数据对应的隶属度值,然后,根据样本数据对应的隶属度值,计算样本数据所属聚类的聚类中心的范围区间值,比如,可以采用下式进行计算

其中,该样本数据对应的隶属度值为xi,t(t1,t2)表示聚类中心的范围区间值,n为聚类中心的数量,t1表示范围区间值的最小值,t2表示范围区间值的最大值。

然后,可以根据样本数据对应的隶属度值、样本数据所属聚类的聚类中心以及样本数据所属聚类的聚类中心的范围区间值对样本数据的数据情况进行预测,得到样本数据的预测数据情况,当真实数据情况和预测数据情况一致时,可以认为样本数据所属聚类的聚类中心满足预设条件,然后,可以满足预设条件的聚类中心对应的范围区间值至本地;当当真实数据情况和预测数据情况不一致时,对样本数据所属聚类的聚类中心进行调整,直到样本数据所属聚类的聚类中心满足预设条件完毕。也即,在一些实施例中,步骤“获取目标聚类中心对应的范围区间值”,具体可以包括:从保存的范围区间值中获取目标聚类中心对应的范围区间值。

可选的,在一些实施例中,具体还可以包括:

(31)提取样本数据对应的聚类中心的属性信息;

(32)构建属性信息与范围区间值之间的映射关系。

比如,样本数据集包括两个样本数据,其中,一个样本数据对应的聚类中心的属性信息为:金融,另一个样本数据对应的聚类中心对应的属性信息为:医疗,那么,可以构建属性信息与范围区间值之间的映射关系,便于后续使用,即,在一些实施例中,步骤“获取聚类中心对应的范围区间值”,具体可以包括:

(41)提取目标聚类中心对应的属性信息;

(42)基于预设映射关系,从保存的范围区间值中获取目标聚类中心对应的范围区间值。

比如,当确定了目标聚类中心对应的属性信息为“金融”时,可以通过预设映射关系,从保存的范围区间值中获取与“金融”对应的范围区间值。

可选的,在一些实施例中,步骤“通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果”,具体可以包括:

(51)提取解密后的聚类结果中所有的聚类中心;

(52)计算目标聚类中心与各聚类中心之间的距离;

(53)基于隶属度值、范围区间值以及距离对待检测数据进行检测,得到待检测数据对应的检测结果。

具体的,可以通过目标聚类中心与各聚类中心之间的距离,判断目标聚类中心的所有数据是否正常,通过隶属度值以及范围区间值,判断待检测数据是否正常,当目标聚类中心与各聚类中心之间的距离小于范围区间值的最大值时,可以判断目标隶属度值是否位于目标聚类中心的范围区间值内,若目标隶属度值位于目标聚类中心的范围区间值内,则确定当前处理对象为正常数据,即,在一些实施例中,步骤“基于隶属度值、范围区间值以及距离对待检测数据进行检测,得到待检测数据对应的检测结果”,具体可以包括:

在距离小于等于第一阈值时,判断目标隶属度值是否位于目标聚类中心的范围区间值内,若目标隶属度值位于目标聚类中心的范围区间值内,则确定待检测对象为正常数据。

比如,在一些实施例中,当目标聚类中心与各聚类中心之间的距离大于范围区间值的最大值时,可以认为该目标聚类中心对应的所有数据都是异常数据,或者,当目标聚类中心与各聚类中心之间的距离小于范围区间值的最大值时,若目标隶属度值不位于目标聚类中心的范围区间值内,则确定当前处理对象为异常数据,也即,步骤“基于隶属度值、范围区间值以及距离对待检测数据进行检测,得到待检测数据对应的检测结果”,具体还可以包括

(61)当目标聚类中心与其他聚类中心之间的距离大于第一阈值时,将当前处理对象确定为异常数据,或者;

(62)当目标聚类中心与其他聚类中心之间的距离小于等于第一阈值,且目标隶属度值不位于目标聚类中心的范围区间值内时,将待检测对象确定为异常数据。

本发明实施例在通过预设同态加密算法对待检测数据进行加密,得到加密后数据后,将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理,然后,接收服务器返回的第一聚类结果,并采用同态加密算法对第一聚类结果进行解密,接着,根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,最后,获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。相较于现有的数据检测方案而言,本发明的数据检测方法可以通过同态加密算法对待检测数据进行加密,因此,服务器无法获取到待检测数据的具体数值,从而,提高了数据检测的安全性;另外,由于服务器可以基于从不同终端获取到的数据对加密后数据进行聚类处理,解决了目前的数据检测方案受限于数据孤岛而导致因数据量过少带来的误报,进而提高数据检测的准确性。

根据实施例所述的方法,以下将举例进一步详细说明。

在本实施例中将以该数据检测装置具体集成在终端中为例进行说明。

请参阅图2a,一种数据检测方法,具体流程可以如下:

201、终端通过预设同态加密算法对待检测数据进行加密,得到加密后数据。

具体的,终端可以根据待检测数据生成密钥,该密钥可以包括公开密钥和私有密钥,若使用公开密钥对数据进行加密,只有使用对应的私有密钥才能解密,然后,将待检测数据分成多个随机值,并根据这多个随机值构建待检测数据对应的多维向量,然后,再通过私钥对这个多维向量进行编码,得到加密后数据。

202、终端将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理。

比如,具体的,终端将加密后数据发送至服务器后,服务器可以基于从不同终端获取到的数据,通过模糊聚类算法对加密后数据进行聚类处理,当然,也可以采用k均值聚类算法。

203、终端接收服务器返回的第一聚类结果,采用同态加密算法对第一聚类结果进行解密。

比如,具体的,终端可以获取步骤201所使用的公开密钥对应的私有密钥,对第一聚类结果进行解密。

204、终端根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值。

比如,终端可以从解密后的第一聚类结果提取待检测数据所属聚类的目标聚类中心,以及从解密后的第一聚类结果提取待检测数据属于该目标聚类中心的隶属度值。

205、终端获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

需要说明的是,服务器可以预先获取不同终端数据进行聚类处理,得到多个聚类集合,每个聚类集合均包括至少一个数据,且每个集合对应一个聚类中心,其中,这些数据对应的数据情况均标注为正常,然后,服务器可以计算每个聚类中心对应的范围区间值,在本发明实施例的终端中,首先可以获取获取包括多个数据情况标注为正常的样本数据的样本数据集,然后,该终端可以通过预设同态加密算法对样本数据集的样本数据进行加密,得到加密数据集,然后,终端将加密数据集发送至服务器,以便服务器基于从不同终端获取到的数据对加密数据集中的数据进行聚类处理,并接收服务器返回的第二聚类结果,采用同态加密算法对第二聚类结果进行解密,再然后,终端可以根据解密后的第二聚类结果确定样本数据所属聚类的聚类中心以及样本数据对应的隶属度值,接着,终端可以根据样本数据对应的隶属度值,计算样本数据所属聚类的聚类中心的范围区间值,最后,终端根据真实数据情况和预测数据情况,对样本数据所属聚类的聚类中心进行调整,直到样本数据所属聚类的聚类中心满足预设条件完毕,终端还可以保存满足预设条件的聚类中心对应的范围区间值。

为了提高数据检测的效率,终端可以构建聚类中心的属性信息与范围区间值之间的映射关系,比如,样本数据集包括两个样本数据,其中,一个样本数据对应的聚类中心的属性信息为:金融,另一个样本数据对应的聚类中心对应的属性信息为:医疗,那么,终端可以构建属性信息与范围区间值之间的映射关系,便于后续使用,如图2b所示。

在实际的数据检测过程中,终端,可以通过目标聚类中心与各聚类中心之间的距离,判断目标聚类中心的所有数据是否正常,通过隶属度值以及范围区间值,判断待检测数据是否正常,当目标聚类中心与各聚类中心之间的距离小于范围区间值的最大值时,可以判断目标隶属度值是否位于目标聚类中心的范围区间值内,若目标隶属度值位于目标聚类中心的范围区间值内,则确定当前处理对象为正常数据,当目标聚类中心与各聚类中心之间的距离大于范围区间值的最大值时,可以认为该目标聚类中心对应的所有数据都是异常数据,或者,当目标聚类中心与各聚类中心之间的距离小于范围区间值的最大值时,若目标隶属度值不位于目标聚类中心的范围区间值内,则确定当前处理对象为异常数据。

本发明实施例的终端在通过预设同态加密算法对待检测数据进行加密,得到加密后数据后,终端将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理,然后,终端接收服务器返回的第一聚类结果,并采用同态加密算法对第一聚类结果进行解密,接着,终端根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,最后,终端获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。相较于现有的数据检测方案而言,本发明的终端可以通过同态加密算法对待检测数据进行加密,因此,服务器无法获取到待检测数据的具体数值,从而,提高了数据检测的安全性;另外,由于服务器可以基于从不同终端获取到的数据对加密后数据进行聚类处理,解决了目前的数据检测方案受限于数据孤岛而导致因数据量过少带来的误报,进而提高数据检测的准确性。

为了便于对本发明实施例提供的数据检测方法的理解,请参阅图2c,以通过数据检测平台进行数据检测的场景为例进行说明,首先,用户通过终端登录该数据检测平台,当用户的用户标识验证通过后,用户可以通过终端向服务器上传待检测数据,终端可以获取到待检测数据,然后,终端通过预设同态加密算法对待检测数据进行加密,得到加密后数据,并将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密后数据进行聚类处理,接着,终端接收服务器返回的第一聚类结果,并采用同态加密算法对第一聚类结果进行解密,再然后,终端根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,接着,终端获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果,最后,终端可以显示与该检测结果对应的界面,如图2d所示,可以看出该待检测数据为异常数据,并且该界面上显示有攻击者的信息如网络地址、攻击时间以及攻击事件涉及的端口数等等。

为便于更好的实施本发明实施例的数据检测方法,本发明实施例还提供一种基于上述数据检测装置(简称检测装置)。其中名词的含义与上述数据检测方法中相同,具体实现细节可以参考方法实施例中的说明。

请参阅图3a,图3a为本发明实施例提供的数据检测装置的结构示意图,其中该检测装置可以包括加密模块301、发送模块302、解密模块303、确定模块304、获取模块305以及检测模块306,具体可以如下:

加密模块301,用于通过预设同态加密算法对待检测数据进行加密,得到加密后数据。

其中,加密模块301可以从本地数据库中获取需要检测的待检测数据,然后,通过预设同态加密算法对待检测数据进行加密,得到加密后数据。

发送模块302,用于将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理。

由于加密后数据是通过预设同态加密算法加密后的待检测数据,因此,服务器无法获取到待检测数据的真实值,并且,服务器可以获取不同终端的数据,这些数据也可以是经过加密处理的数据,然后,服务器基于这些数据对加密后数据进行聚类处理,这样可以减小由于终端的数据量不足而带来的误报,进而提高数据检测的准确性。

解密模块303,用于接收服务器返回的第一聚类结果,采用同态加密算法对第一聚类结果进行解密。

可选的,在一些实施例中,解密模块303具体用于:基于预设同态加密算法,获取待检测数据对应的解密函数,通过解密函数对第一聚类结果进行解密处理。

由于服务器返回的第一聚类结果是加密后数据对应的聚类结果,因此,需要采用同态加密算法对第一聚类结果进行解密,比如,解密模块303可以根据同态加密算法获取到相应的解密函数,然后,通过该解密函数对第一聚类结果进行解密。

确定模块304,用于根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值。

确定模块304可以从解密后的第一聚类结果提取待检测数据所属聚类的目标聚类中心,以及从解密后的第一聚类结果提取待检测数据属于该目标聚类中心的隶属度值。

获取模块305,用于获取目标聚类中心对应的范围区间值。

可选的,在一些实施例中,请参阅图3b,检测装置还可以包括训练模块307,训练模块具体用于:获取样本数据集,样本数据集包括多个数据情况标注为正常的样本数据,通过预设同态加密算法对样本数据集的样本数据进行加密,得到加密数据集,将加密数据集发送至服务器,以便服务器基于从不同终端获取到的数据对加密数据集中的数据进行聚类处理,接收服务器返回的第二聚类结果,采用同态加密算法对第二聚类结果进行解密,根据解密后的第二聚类结果确定样本数据所属聚类的聚类中心以及样本数据对应的隶属度值,根据样本数据对应的隶属度值,计算样本数据所属聚类的聚类中心的范围区间值,通过样本数据对应的隶属度值、样本数据所属聚类的聚类中心以及样本数据所属聚类的聚类中心的范围区间值对样本数据的数据情况进行预测,得到样本数据的预测数据情况,根据真实数据情况和预测数据情况,对样本数据所属聚类的聚类中心进行调整,直到样本数据所属聚类的聚类中心满足预设条件完毕,保存满足预设条件的聚类中心对应的范围区间值;

可选的,在一些实施例中,获取模块305具体用于:从保存的范围区间值中获取目标聚类中心对应的范围区间值。

可选的,在一些实施例中,请参阅图3c,检测装置还包括构建模块308,构建模块308具体用于:提取样本数据对应的聚类中心的属性信息,构建属性信息与范围区间值之间的映射关系。

可选的,在一些实施例中,确定模块304具体用于:提取目标聚类中心对应的属性信息,基于预设映射关系,从保存的范围区间值中获取目标聚类中心对应的范围区间值。

检测模块306,用于通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

具体的,检测模块306可以通过目标聚类中心与各聚类中心之间的距离,判断目标聚类中心的所有数据是否正常,通过隶属度值以及范围区间值,判断待检测数据是否正常。

可选的,在一些实施例中,检测模块306具体可以用于:在距离小于等于第一阈值时,判断目标隶属度值是否位于目标聚类中心的范围区间值内,若目标隶属度值位于目标聚类中心的范围区间值内,则确定待检测对象为正常数据。

可选的,在一些实施例中,检测模块306具体还可以用于:当目标聚类中心与其他聚类中心之间的距离大于第一阈值时,将待检测对象确定为异常数据,或者,当目标聚类中心与其他聚类中心之间的距离小于等于第一阈值,且目标隶属度值不位于目标聚类中心的范围区间值内时,将待检测对象确定为异常数据。

本发明实施例的加密模块301在通过预设同态加密算法对待检测数据进行加密,得到加密后数据后,发送模块302将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理,然后,解密模块303接收服务器返回的第一聚类结果,并采用同态加密算法对第一聚类结果进行解密,接着,确定模块304根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,最后,获取模块305获取目标聚类中心对应的范围区间值,检测模块306通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。相较于现有的数据检测方案而言,本发明的加密模块301可以通过同态加密算法对待检测数据进行加密,因此,服务器无法获取到待检测数据的具体数值,从而,提高了数据检测的安全性;另外,由于服务器可以基于从不同终端获取到的数据对加密后数据进行聚类处理,解决了目前的数据检测方案受限于数据孤岛而导致因数据量过少带来的误报,进而提高数据检测的准确性。

此外,本发明实施例还提供一种电子设备,如图4所示,其示出了本发明实施例所涉及的电子设备的结构示意图,具体来讲:

该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。

电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:

通过预设同态加密算法对待检测数据进行加密,得到加密后数据,将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理,接收服务器返回的第一聚类结果,采用同态加密算法对第一聚类结果进行解密,根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

以上各个操作的具体实施可参见前面的实施例,在此不再赘述。

本发明实施例在通过预设同态加密算法对待检测数据进行加密,得到加密后数据后,将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理,然后,接收服务器返回的第一聚类结果,并采用同态加密算法对第一聚类结果进行解密,接着,根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,最后,获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。相较于现有的数据检测方案而言,本发明的数据检测方法可以通过同态加密算法对待检测数据进行加密,因此,服务器无法获取到待检测数据的具体数值,从而,提高了数据检测的安全性;另外,由于服务器可以基于从不同终端获取到的数据对加密后数据进行聚类处理,解决了目前的数据检测方案受限于数据孤岛而导致因数据量过少带来的误报,进而提高数据检测的准确性。

本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。

为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种数据检测方法中的步骤。例如,该指令可以执行如下步骤:

通过预设同态加密算法对待检测数据进行加密,得到加密后数据,将加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对加密后数据进行聚类处理,接收服务器返回的第一聚类结果,采用同态加密算法对第一聚类结果进行解密,根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,获取目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

以上各个操作的具体实施可参见前面的实施例,在此不再赘述。

其中,该存储介质可以包括:只读存储器(rom,readonlymemory)、随机存取记忆体(ram,randomaccessmemory)、磁盘或光盘等。

由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种数据检测方法中的步骤,因此,可以实现本发明实施例所提供的任一种数据检测方法所能实现的有益效果,详见前面的实施例,在此不再赘述。

以上对本发明实施例所提供的一种数据检测方法、装置、电子设备以及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:

1.一种数据检测方法,其特征在于,包括:

通过预设同态加密算法对待检测数据进行加密,得到加密后数据;

将所述加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密后数据进行聚类处理;

接收服务器返回的第一聚类结果,并采用所述同态加密算法对第一聚类结果进行解密;

根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值;

获取所述目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

2.根据权利要求1所述的方法,其特征在于,所述通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果,包括:

提取解密后的聚类结果中所有的聚类中心;

计算所述目标聚类中心与各聚类中心之间的距离;

基于隶属度值、范围区间值以及距离对待检测数据进行检测,得到待检测数据对应的检测结果。

3.根据权利要求2所述的方法,其特征在于,所述基于隶属度值、范围区间值以及距离对待检测数据进行检测,得到待检测数据对应的检测结果,包括:

在所述距离小于等于第一阈值时,判断目标隶属度值是否位于目标聚类中心的范围区间值内,若目标隶属度值位于目标聚类中心的范围区间值内,则确定待检测对象为正常数据。

4.根据权利要求3所述的方法,其特征在于,还包括:

当目标聚类中心与其他聚类中心之间的距离大于第一阈值时,将当前处理对象确定为异常数据,或者;

当目标聚类中心与其他聚类中心之间的距离小于等于第一阈值,且目标隶属度值不位于目标聚类中心的范围区间值内时,将待检测对象确定为异常数据。

5.根据权利要求1至4任一项所述的方法,其特征在于,所述获取所述聚类中心对应的范围区间值之前,还包括:

获取样本数据集,所述样本数据集包括多个数据情况标注为正常的样本数据;

通过预设同态加密算法对所述样本数据集的样本数据进行加密,得到加密数据集;

将所述加密数据集发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密数据集中的数据进行聚类处理;

接收服务器返回的第二聚类结果,采用所述同态加密算法对第二聚类结果进行解密;

根据解密后的第二聚类结果确定样本数据所属聚类的聚类中心以及样本数据对应的隶属度值;

根据样本数据对应的隶属度值,计算样本数据所属聚类的聚类中心的范围区间值;

通过样本数据对应的隶属度值、样本数据所属聚类的聚类中心以及样本数据所属聚类的聚类中心的范围区间值对样本数据的数据情况进行预测,得到样本数据的预测数据情况;

根据真实数据情况和预测数据情况,对样本数据所属聚类的聚类中心进行调整,直到样本数据所属聚类的聚类中心满足预设条件完毕;

保存满足预设条件的聚类中心对应的范围区间值;

所述获取所述目标聚类中心对应的范围区间值,包括:从保存的范围区间值中获取所述目标聚类中心对应的范围区间值。

6.根据权利要求5所述的方法,其特征在于,还包括:

提取样本数据对应的聚类中心的属性信息;

构建属性信息与范围区间值之间的映射关系。

7.根据权利要求6所述的方法,其特征在于,所述获取所述聚类中心对应的范围区间值,包括:

提取所述目标聚类中心对应的属性信息;

基于预设映射关系,从保存的范围区间值中获取所述目标聚类中心对应的范围区间值。

8.根据权利要求1至4任一项所述的方法,其特征在于,所述采用所述同态加密算法对第一聚类结果进行解密,包括:

基于预设同态加密算法,获取待检测数据对应的解密函数;

通过解密函数对第一聚类结果进行解密处理。

9.一种数据检测装置,其特征在于,包括:

加密模块,用于通过预设同态加密算法对待检测数据进行加密,得到加密后数据;

发送模块,用于将所述加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密后数据进行聚类处理;

解密模块,用于接收服务器返回的第一聚类结果,采用所述同态加密算法对第一聚类结果进行解密;

确定模块,用于根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值;

获取模块,用于获取所述目标聚类中心对应的范围区间值;

检测模块,用于通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果。

10.根据权利要求9所述的装置,其特征在于,所述所述检测模块包括:

提取单元,用于提取解密后的聚类结果中所有的聚类中心;

计算单元,用于计算所述目标聚类中心与各聚类中心之间的距离;

检测单元,用于基于隶属度值、范围区间值以及距离对待检测数据进行检测,得到待检测数据对应的检测结果。

11.根据权利要求10所述的装置,其特征在于,所述检测单元具体用于:

在所述距离小于等于第一阈值时,判断目标隶属度值是否位于目标聚类中心的范围区间值内,若目标隶属度值位于目标聚类中心的范围区间值内,则确定待检测对象为正常数据。

12.根据权利要求10所述的装置,其特征在于,所述检测单元具体还用于:

当目标聚类中心与其他聚类中心之间的距离大于第一阈值时,将当前处理对象确定为异常数据,或者;

当目标聚类中心与其他聚类中心之间的距离小于等于第一阈值,且目标隶属度值不位于目标聚类中心的范围区间值内时,将待检测对象确定为异常数据。

13.根据权利要求9至12任一项所述的装置,其特征在于,还包括训练模块,所述训练模块具体用于:

获取样本数据集,所述样本数据集包括多个数据情况标注为正常的样本数据;

通过预设同态加密算法对所述样本数据集的样本数据进行加密,得到加密数据集;

将所述加密数据集发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密数据集中的数据进行聚类处理;

接收服务器返回的第二聚类结果,采用所述同态加密算法对第二聚类结果进行解密;

根据解密后的第二聚类结果确定样本数据所属聚类的聚类中心以及样本数据对应的隶属度值;

根据样本数据对应的隶属度值,计算样本数据所属聚类的聚类中心的范围区间值;

通过样本数据对应的隶属度值、样本数据所属聚类的聚类中心以及样本数据所属聚类的聚类中心的范围区间值对样本数据的数据情况进行预测,得到样本数据的预测数据情况;

根据真实数据情况和预测数据情况,对样本数据所属聚类的聚类中心进行调整,直到样本数据所属聚类的聚类中心满足预设条件完毕;

保存满足预设条件的聚类中心对应的范围区间值;

所述获取模块具体用于从保存的范围区间值中获取所述目标聚类中心对应的范围区间值。

14.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1-8任一项所述数据检测方法的步骤。

15.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-8任一项所述数据检测方法的步骤。

技术总结

本发明实施例公开了一种数据检测方法、装置、电子设备以及存储介质,其中,该数据检测方法包括:通过预设同态加密算法对待检测数据进行加密,得到加密后数据,将所述加密后数据发送至服务器,以便服务器基于从不同终端获取到的数据对所述加密后数据进行聚类处理,接收服务器返回的第一聚类结果,并采用所述同态加密算法对第一聚类结果进行解密,根据解密后的第一聚类结果确定待检测数据所属聚类的目标聚类中心和隶属度值,获取所述目标聚类中心对应的范围区间值,并通过隶属度值、范围区间值以及目标聚类中心对待检测数据进行检测,得到待检测数据对应的检测结果,该方案可以提高数据检测的准确性。

技术研发人员:赵瑞辉;石维;苏晓东;陈婷

受保护的技术使用者:腾讯云计算(北京)有限责任公司

技术研发日:.11.08

技术公布日:.02.28

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。