“真实世界研究数据分析”系列(八)
无论在临床研究,还是公共卫生研究,好的SCI收录论文中涉及多分组的数据往往给出一个P trend值。目前在我国中文论文却不常见,本文就开展P trend分析的介绍。
P trend 在论文中非常常见,比如《美国流行病学杂志》一篇研究女性子宫内膜癌与卵巢癌的相关影响因素论文中,在以最低水平为对照开展哑变量设置分析计算各组的HR同时,就给出不同BMI、饮酒、健康运动等行为与癌症发生的P trend值。
又比如,另外一篇探讨饮茶量与癌症发生的关系的文章,在分析每日不同的饮茶量与癌症的关系时,计算了Ptrend值。
一、什么是P trend?
P trend是一个P值。
该P值是统计学中趋势性检验的结果。医学中的趋势性是事物的结局指标随着原因指标水平改变而发生的线性趋势性改变,反映的是剂量反应关系或者剂量效应关系。
说通俗一些,趋势性反映的是结局变量和原因变量是否存在着线性相关性。但是,趋势性分析常用于当暴露指标或者处理因素变量为有序多分类的情况。在回归分析中,一般要求自变量是有序多分类数据。
趋势性检验,即对这种线性趋势性是否存在着作统计学假设检验,计算P值。如果P<0.05,则说明趋势性成立。
在女性卵巢癌和子宫内膜癌的案例里,运动锻炼时间变量分为<1.5h、1.6-6.0h、6.1-12.0 h、12.1-21.5 h,>21.5 h /week;与<1.5h相比,随运动时间的上升一个等级,研究对象子宫内膜癌的发病相对风险HR值分别为1.0、0.94、0.91、0.91、0.84,HR下降的趋势明显,因此P trend=0.06,提示该下降趋势具有统计学有统计学差异,说明卵巢癌的发病风险有随着运动量增加而减少的趋势。
同时对于卵巢癌来说,其HR值分别是1.0、1.21、1.10、1.22、1.10,P trend=0.44,趋势不明显。
P trend有什么意义?
P trend 主要发挥辅助性的作用,同时增加文章的内容与深度。特别是,在其它主要研究结局未取得统计学意义时,趋势性检验结果可能会带来额外的信息。
同样以子宫内膜癌与运动锻炼时间为例。以不锻炼为对照,其它各组均无统计学意义,但P trend有统计学意义,这也能弥补部分分析的遗憾。
二、什么时候会开展趋势性检验
趋势性检验在高分SCI论文较为常见。
一般来说,无论结局指标是均数、中位数、率、OR值、RR值、HR值,均可以开展趋势性检验
对于自变量或者原因变量而言,一般情况下,趋势性检验发生于原因指标是定量数据或者等级数据的情况下:
1.对于等级变量,根据上述趋势性介绍内容,开展趋势性检验非常常见
2.对于定量变量,同样需要开展趋势性检验,但是,一般都需要现将定量数据转为等级数据,再进行趋势性检验
三、如何开展趋势性检验计算P trend
首先,必须再次说明,趋势性检验只是辅助性的结果,一般难以独挑大梁。一般情况下,它在有序分类变量哑变量设置分析的基础上进行。
具体过程如下:
第一;定量变量转换为有序分类变量(本身为等级变量的可忽略本步)
定量变量转为有序的方法一般有三种。一种根据存在着具有临床或者实际意义的界值,比如BMI指数,转换的方式是按照18、24.5、28界值分为四组第二种方法,是根据整数界值,比如年龄 30岁、40岁、50岁之类;第三种方法,如果上述方法都不合适,可以采用四分位数法。比如女性卵巢癌和子宫内膜癌案例里的运动锻炼时间,本方法也很常见。
第二步,开展多组比较以及设置对照组分析。回归分析中,一般以设置哑变量的进行:以某一组作为对照组进行比较,分别计算其它各组的效益指标。因此女性卵巢癌和子宫内膜癌的案例里,可以得到所有各组的HR值以及95%置信区间,其中HR=1为对照组。
第三步,结合统计学方法进行趋势性检验,计算P trend值
上述基本步骤本人在上一篇已经做过类似地介绍,希望诸位能够将两篇论文结合起来进行学习。真实世界研究:自变量是定量数据,怎么构建回归模型?
四、如何结合SPSS统计软件计算P trend
本文以SPSS 25.0 为例,计算P trend 值
实际上,P trend计算不仅仅可通过回归分析进行。一般情况下,针对的数据和不同的要求,P trend计算有4种基本方法。
1.方差分析中的P trend计算
当结局指标为正态分布的定量变量数据,分组变量为多组及有等级的数据时。此时,可采用方差分析和趋势性检验联合的方法。
比如,为了研究锻炼强度对人血压的影响,研究因素是锻炼强度(高、中、低),血压为运动1个小时后收缩压。。那么一般情况下,可以从采用方差分析、两两比较、及趋势性检验分析来进行
2. 卡方检验中的P trend计算
当结局变量是二分类结局(分组变量必须是有序分类)时,往往采用卡方检验,同时可以采用的趋势性检验是关于剂量和率的关系
上图中线性关联,英文Linear-by-LinearAssociation得到的P值即为P trend值
3. 秩相关计算P trend 值
当结局变量多分类结局(分组变量必须是有序分类)时,采用的Spearman 或者或者kendall的方法开展趋势性检验
4.回归分析时的趋势性检验(以COX回归分析)
本文以上一篇为案例进行回归分析的趋势性检验。
一项基于孕妇的出生队列,研究希望探讨低出生体重婴儿的影响因素。结果变量为是否娩出低出生体重儿,为二分类的结果,考虑的影响因素有妇妊娠前体重、产妇年龄、种族、是否饮酒、早产次数、是否患高血压等。
统计分析方法:是否发生低出生体重为应变量,其余是自变量,可构建logistic回归开展影响因素分析。
本文以随访次数为例,探讨在随访次数增加时,低出生体重率趋势性结果。
首先,将随访次数转为3分类数据。
其次,设置哑变量,开展以0次为对照,进行分析。
可以发现,以0次为对照,随访次1次HR值为0.422,随访次为2次及以上者,为0.364,趋势明显。
接种,开展趋势性检验。
回归分析的趋势性检验其实很简单,只要把随访次数1这一个变量,不设置哑变量,直接作为连续型变量直接纳入,分析即可。
这里的P=0.007,即为Ptrend,可以反映为随访次数每增加一个等级,低出生体重的风险趋势性下降
最终得到的结果绘制成统计表如下:
上述就是关于P trend计算的全部介绍。现在,你理解并学会计算P trend了吗?它很常见,也很有意义,希望诸位能够掌握。
“如何分析真实世界研究数据”系列更多文章