介绍: 本工具可对多组数据(2-5组)自动进行单因素分析(独立样本t检验、方差分析、非参数检验和卡方检验等)并自动生成三线表。 您需要上传原始数据并定义相关变量的参数。 请将数据整理好,保证数据的变量名是字母或数字,原始数据中仅包含数字、不包含文字、符号等。
“基线”是什么,很重要吗?当然!“基线”一般是结果部分的Table 1(the first table),大多时候Table 1会提供几组间的基线特征是否均衡,研究对象的特征,包括人口学资料、临床和社会特征……,这么多资料, 你还在一个个做单因素分析,并汇总数据结果吗?怎么在1分钟后做好基线描述和统计检验呢?只需要下面3步即可。
1、表格名称:默认基线表,可自行修改
2、所有分类变量中最多的类别数:默认5,即默认分类变量中最多有5个分类, 如果一个变量取值个数在5及以下,系统会认为其是分类变量,如果变量的取值个数在5以上, 系统认为其是连续变量。如果您的数据中分类变量中最多有10个分类取值,您可修改为10
3、分组变量名:即我们的分组变量status
4、结果保留小数位数:默认2,您可自行修改
1、是否报告总样本参数:即是否报告所有研究对象的特征。
2、连续数据正态性判断:假设所有连续变量均为正态分布、或非正态分布,也可以选择由系统通过KS检验判断数据正态性
3、正态分布的结果形式:默认均值±标准差
4、非正态分布的结果形式:默认中位数(p25,p75)
5、是否报告每组样本数:即是否报告每个变量的样本数
在NCCTG肺癌研究中,按结局变量status分为两组,即生存组和死亡组,要对比的基线特征包含以下变量。我们选择以“生存状态status”作为分组变量,描述每一组研究对象的特征并进行检验。
数据注释:
变量名 | 变量标签 |
inst | 机构代码 |
time | 生存时间 |
status | 生存状态 |
age | 年龄 |
sex | 性别 |
ph.ecog | ECOG评分 |
ph.karno | Karnofsky评分(医生评) |
pat.karno | Karnofsky评分(患者自评) |
meal.cal | 食物摄入热量 |
wt.loss | 体重减轻 |
数据样例:
分组变量与检验变量不能同时选择
可点击下载word文档进行下载
本模块的所有检验结果应用R软件完成,已经和SPSS进行比对,和SPSS软件的统计分析结果一致。
结果解读:本研究采用4.0.3 统计软件进行统计分析。连续(定量)数据如果符合正态分布,采用均值±标准差表示, 两组间比较采用独立样本t检验;如果不符合正态分布,采用中位数(25%分位数,75%分位数)表示,两组间比较采用wilcox检验。 分类(定性)数据采用频数(百分比)进行统计描述,组间比较采用χ2 检验或Fisher’s精确检验。当双侧p值小于0.05认为差异有统计学意义。 经统计检验,time、sex、ph.ecog、ph.karno和pat.karno在status的各组间差异具有统计学意义。