前言

本书为 Modelling Survival Data in Medical Research 4th Edition, by David Collett 的翻译。翻译的目的有二:

  1. 现有的生存分析中文专著屈指可数,其中能与原书在内容的广度和深度方面对标的数量为 \(\log1\)
  2. 在人类彻底被 AI 取代之前,或至少翻译的工作被 AI 取代之前,或至少专著翻译的工作被 AI 取代之前,译者希望能有所贡献。

可以说,对于那些愿意付出必要努力来为生存数据适当建模的研究者,本书是难得的宝藏。

“There are no routine statistical questions, only questionable statistical routines.” - D. R. Cox

可点击带 \(\blacktriangleright\) 的标题以展开图表,例如

点我看本书封面


排版说明:

  • 由于第 3 章和第 5 章篇幅较长、公式较多,为减少渲染时间,已将这两章划分为两个页面。尽管如此,每次打开页面仍需加载一段时间;
  • 丰富的示例贯穿全书,为方便跳转,示例均给出了交叉引用;
  • 图表一般都在上下文中,不给出交叉引用;对于所跨章节较多的图表,会在上下文中重复给出;
  • 为保持阅读的连贯性,图表均已折叠(如上面的封面图片)。

阅读提示:

  • 左侧为“章”的导航栏,右侧为各章中“节”的导航栏;
  • 左上角的搜索框一般需要两个字及以上的关键词才会显示结果(例如搜索“风”不显示结果,而搜索“风险”会给出结果),原因不详;
  • 本书给出了丰富的超链接,为方便对照阅读,可按住 Ctrl 后点击超链接以打开新的标签页。

水平不足,能力有限。Email:

原书前言

本书描述并说明了使用来自生物医学研究的各种例子对生存数据进行分析的建模方法。我在介绍这一主题的多场讲座和课程(包括入门和高级水平)方面的经验,以及在提供生存数据分析建议方面的经验,对其内容产生了重大影响。最终呈现的是一本关于中等水平生存分析的全面实用的书,我希望它将继续满足制药行业和生物医学研究中心的统计学家、分析自己数据的科学家和临床医生,以及攻读本科或研究生生存分析课程的学生们的需求。

本版有一个关于贝叶斯生存分析的新章节,以反映这种方法越来越受欢迎。鉴于现代统计方法实施的计算机软件资源越来越丰富,其他章节已被改写或广泛修订。具体来说,对关于参数模型的第 5 章进行了修订,并在新的第 6 章中描述了基于样条的风险和累积风险函数的参数模型。已重写关于区间删失生存数据的第 9 章,以提供分析这类数据的现代方法。此外,还纳入了有关评估拟合模型的预测能力、纵向和生存数据的联合建模以及分段指数模型的新内容。R 软件现在广泛用于生存数据的分析,这不仅是因为该软件能跟上统计发展,还因为它对所有人都是免费开放的。新增的最后一章展示了如何使用 R 软件实现本书中所述的方法,并指导读者如何解读输出结果,以及如何将这些结果与前面章节使用的示例进行对照理解。

本书的主要部分由第 1 章到第 7 章组成。在第 1 章中介绍了生存分析之后,第 2 章描述了总结生存数据和比较两组或两组以上生存时间的方法。第 3 章介绍了建模方法,其中详细介绍了 Cox 回归模型。接下来的一章介绍了检查拟合模型的充分性的方法。第 5 章介绍了参数比例风险模型和加速失效时间模型。在第 6 章关于灵活参数模型之后,第 7 章介绍了参数模型的模型检查诊断。

其余章节描述了基本模型的一些扩展。第 8 章介绍了时依变量的使用,第 9 章考虑了区间删失数据的分析。第 10 章介绍了脆弱模型,以允许使用随机效应对个体或个体组之间的差异进行建模。第 11 章总结了在无法做出比例风险假设时可以使用的技术,并展示了如何使用这些模型来比较多个机构的生存结局。第 12 章介绍了包含不同死因的竞争风险模型,而第 13 章则描述了 Cox 回归模型的扩展,以应对相同或不同类型的多次事件,包括事件历史分析。第 14 章总结了当存在相依删失时分析数据的方法,第 15 章介绍了如何确定以生存时间为结果变量的研究的样本量要求。第 16 章和第 17 章分别介绍了贝叶斯方法和 R 软件的使用。

每一章都包含足够的方法细节,以便读者对技术和它们所基于的假设有深入的理解,并帮助读者调整方法来处理非标准问题。前面几章中的一些例子是基于较少的观测数据构建的,这比通常的生物医学研究项目要少。这使得分析方法更容易被阐明,同时也方便将表格形式的结果展示与从计算机软件获得的输出结果进行对比。附录中给出了一些额外的数据集,可用于更全面地理解方法论,或作为学生练习。本书中使用的所有数据集均可以电子形式从出版商的网站 https://www.routledge.com 获取。(译者注:具体链接为这里

在撰写本书时,我假定读者具有统计方法的基本知识,并且对线性回归分析有一定的了解。有时会使用矩阵代数,但了解线性代数并不是必要条件。每章末尾都给出了参考书目说明和延伸阅读的建议,但为了不中断流程,文本本身的参考文献已保持在最低限度。

我感谢已故的 Doug Altman, James Gallagher, Alan Kimber, Sandro Leidi, Mike Patefield, Anne Whitehead 和 John Whitehead 在准备本书当前版本和早期版本时提供的帮助,并感谢 NHS 血液和移植部门的允许在许多示例中使用来自英国移植登记处的数据。我特别感谢所有不厌其烦地告诉我早期版本中的错误的人。尽管这些内容已得到纠正,但我很高兴获悉本版本中的任何进一步错误、歧义和遗漏:。最后,我要感谢我的妻子 Janet 在本书写作期间的支持和鼓励。

David Collett

October 2022