第五章 计数资料的统计描述
日期: 2020-11-22 作者:wxhyihuan
本章节主要时计数资料相关的概念和统计基础,概念的细节比较多,是后面进行离散变量的统计的基础!可以结合树上的案例,更好的理解和引用概念,此处不累述。
计数资料(Enumeration data,Categorical data),又称定性资料或无序分类资料,是相对于计量资料(Measurement data,又称连续型变量资料, 是指由数值变量的测量值组成的资料)的一个统计概念,是指先将观察单位按其性质或类别分组,然后清点各组观察单位个数所得的资料。 其特点是对每组观察单位主要研究其数量的多少,属非连续性资料。
计数资料常见的数据形式是绝对数,如某病的出院人数、治愈人数等,但绝对数通常不具有可比性,如甲、乙两个医院某病出院人数不同时, 比较两医院该病的死亡人数没有意义,因此需要在绝对数的基础上计算相对数。常用的相对数指标有比、比例和率三种:
- 当比例与时间有关系时称为率(Rate),或称强度相对数;
- 当比的分子是分母的一部分时,称为比例(Proportion),或称结构相对数;
- 两个有关指标之比称为比(Ratio),或称相对比;
5.1 常用相对数
5.1.1 强度相对数
强度相对数也称强度相对指标或强度指标,是指同一时期内两个性质不同而又有一定联系的总量指标之比。它可以反映社会经济现象的强度、密度和普遍程度。 其计算公式为: 强度相对数(率)=某时期内发生某现象的观察单位数同时期内可能发生某现象的观察单位总数×比例基数
比例基数主要是调整通过百分/千分/万分等基数,是计算结果能保留适当有效位数,便于阅读。另外就是要注意,不要忽略公式中时间的范畴,所赋予计算结果是 特定观察时期内的,在结果解释时,这个周期(比如年,月,周,天,时)的含义体现。
5.1.2 结构相对数
结构相对数又称比重指标或结构相对指标,是在分组情况下,总体内部各组的数值与总体数值相比计算得到的相对数。它反映总体内部的构成情况, 表明总体中各部分所占比重的大小、一般用百分数表示,计算公式为: 结构相对数(比例)=某一构成部分的观察单位数同一事物各组成部分的观察单位总数×100%
显然,全体内各组结构相对数的总和应为100%。注意的是,各部分之间是互相影响,某部分的比例既受到自身观察数量变化的影响, 也受到其他部分的观察数量的变化影响。
5.1.3 相对比
表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的百分之几或几倍,其计算公式为: 相对比(比)=指标甲指标乙(×100%)
指标甲乙可以是绝对数,相对数或平均数。
5.1.4 应用相对数的注意点
- 比例不能代替率,即结构相对数不能代替强度相对数
- 计算相对数应该有足够的数量
- 正确计算合计率 对分组资料计算合计表(或称平均率)时,不能简单的由各组率相加或平均而得,要用合计的有关实际数字进行计算
- 注意资料的可比性在比较相对数时,除了要对比的因素(如不同的药物),其余的影响因素应尽可能相同或相近。在临床研究和动物实验时,应遵循随机抽样原则进行分组。下列因素可能影响对比组之间的可比性:
观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经 济条件是否一致或相近等。
观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同,可以分别进行同年龄别、同性 别的小组率比较或对总率(合计率)进行标准化后再作比较。
对比不同时期资料应注意客观条件是否相同,例如,疾病报告制度完善和资料完整的地区或年份,发病率可以“升高”;居民因医疗普及,就诊机会增加,或诊断技术提高,也会引起发病率升高”。因此在分析讨论时,应根据各方面情形全面考虑,慎重对待。
样本率(或构成比)的抽样误差不能仅凭数字表面相差大小下结论,而应进行样本率(或构成比)差别的假设检验。
5.2 率的标准化
当比较的两组资料,其内部各小组率明显不同,且各小组观察例数的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等也明显不同时, 直接比较两个合计率是不合理的。因为其内部构成不同,往往影响 合计率大小。
因此,一种为在两个以上总率(总均数)进行对比时,消除内部构成不同的影响,采用统一的内部构成,分别计算标准化率(Standardized rate)后再做对比的方法,即为标准化方法(Standardization method),是2014年公布的全科医学与社区卫生名词。标准化法的基本思想是:采用某影响因素的统一标准构成以消除构成不同对合计率的影响, 使通过标准化后的合计率具有可比性。注意的是,它与数据的标准化(Normalization)的概念不同,数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。
5.2.1 标准化率的计算
标准化法计算的关键是选择统一的标准构成。常用的标准化方法有直接标准化法和间接标准化法,简称直接法和间接法。根据已有资料的条件,采用不同的方法计算标准化率。如对死亡率的年龄构成标准化,若已知年龄别死亡率,可采用直接法;若只 有总死亡数和年龄别人口数而缺乏年龄别死亡率时,或各年龄组人口数较小,年龄别死亡率不稳定时,宜用间接法。
Ni表示标准年龄别人口数,pi为实际年龄别死亡率,N为标准人口众数,选择标准构成的方法通常有三种:
两组资料中任选组资料的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。标准化率的计算公式: p′=∑NipiN
两组资料各部分人口之和组成的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。标准化率的计算公式: p′=∑(NiN)pi
另外选用一个通用的或便于比较的标准作为两者的“共同标准”,如采用全国、全省或全地区的数据作为标准,这种方法适用于直接法和间接法。标准化率的计算公式: p′=P(r∑niPi)=P×SMR
SMR=r/∑niPi为标准化死亡比(Standardized mortalitu ratio,SMR)。标准化死亡比是被标化组实际死亡数与预期死亡数之比,用SMR表示。若SMR>1,表示被标化人群的死亡率高于标准组;反之,若SMR<1,表示被标化人群的死亡率低于标准组。标准化死亡比可反映某一人群与标准人群的人口死亡的相对水平。