时间终点的样本量计算与模拟

Python 3.10-3.12
R 4.1-4.4
Build YYYYMM
⏱️ 计算中,请稍候。
参数设定
入组设定
模拟与确认设定

参数设定说明

  • 历史对照、预期时间、入组速率、探索时间的时间单位相同,可以为月、年、天。需输入整数
  • 本程序数据成熟度的计算是累计发生的事件数量占设定HR所需事件数量的占比( 参考文献 Control Clin Trials . 2003 Dec;24(6):682-701. )。建议范围0.7-1.0。
  • 样本量预估基于 HR = 历史对照/预期时间 计算。 参考文献 Biometrics. 1983 Jun;39(2):499-503.
  • 入组患者按照肿瘤患者生存分析,默认符合Weibull分布。建议形状参数选择1.5~4。数值越大越右偏。
  • 研究总时间=入组时间+随访时间。“探索时间”是程序迭代查找研究总时间的变量,不超过100。
  • 模拟次数是指有多少次模拟研究总时间的过程,限制不超过100次。
  • 时间终点的样本量计算与模拟介绍

    从统计学角度,这段代码的计算过程和方法主要涉及以下几个方面:

    1. Weibull分布

      代码中使用Weibull分布生成时间到事件(time to event)的数据。Weibull分布是生存分析中常用的模型,可以表示各种不同形状(单调增加或减少)的危险率函数。它的形状参数反映了危险率随时间的变化趋势。

    2. 样本量估计

      根据用户指定的显著性水平、功效、HR值等,可以计算需要的事件总数。事件总数再结合各组的事件比例、入组时间获得各组需要的样本量。

    3. 数据生成过程

      通过模拟患者入组和事件发生的动态过程,生成生存时间数据。这遵循生存分析的客观规律,通过加入随机成分,使得到的数据更加接近实际情况。多次模拟可以评估变异性。

    4. 结果统计

      对模拟结果进行汇总统计,可以直观了解各主要指标的分布情况。计算均值、中位数、置信区间等,进行结果的合理推断。

    5. Kaplan-Meier曲线

      根据给定的参数,对一次完整模拟过程的数据采用Kaplan-Meier方法估计生存分布并绘制曲线。

      Kaplan-Meier Curve of Simulation (demo)

      示例图

    基于Python的生存分析工具集 by Lokyshin