时间终点的样本量计算与模拟 - PySurTool

时间终点的样本量计算与模拟

Python 3.10-3.12

R 4.1-4.4

Build YYYYMM

⏱️ 计算中，请稍候。

选项
源码

参数设定

历史对照

预期时间

试验组占比(试验组/对照组)

alpha设定

Power设定

入组设定

入组速率

希望达到的数据成熟度

Weibull分布形状参数

模拟与确认设定

需要计算的组

探索时间(≤100)

模拟次数(≤100)

输入预期时间

预期入组时间

预期随访时间

参数设定说明

历史对照、预期时间、入组速率、探索时间的时间单位相同，可以为月、年、天。需输入整数。

本程序数据成熟度的计算是累计发生的事件数量占设定HR所需事件数量的占比( 参考文献 Control Clin Trials . 2003 Dec;24(6):682-701. )。建议范围0.7-1.0。

样本量预估基于 HR = 历史对照/预期时间 计算。参考文献 Biometrics. 1983 Jun;39(2):499-503.

入组患者按照肿瘤患者生存分析，默认符合Weibull分布。建议形状参数选择1.5～4。数值越大越右偏。

研究总时间=入组时间+随访时间。“探索时间”是程序迭代查找研究总时间的变量，不超过100。

模拟次数是指有多少次模拟研究总时间的过程，限制不超过100次。

时间终点的样本量计算与模拟介绍

从统计学角度,这段代码的计算过程和方法主要涉及以下几个方面:

Weibull分布

代码中使用Weibull分布生成时间到事件(time to event)的数据。Weibull分布是生存分析中常用的模型,可以表示各种不同形状(单调增加或减少)的危险率函数。它的形状参数反映了危险率随时间的变化趋势。
样本量估计

根据用户指定的显著性水平、功效、HR值等,可以计算需要的事件总数。事件总数再结合各组的事件比例、入组时间获得各组需要的样本量。
数据生成过程

通过模拟患者入组和事件发生的动态过程,生成生存时间数据。这遵循生存分析的客观规律,通过加入随机成分,使得到的数据更加接近实际情况。多次模拟可以评估变异性。
结果统计

对模拟结果进行汇总统计,可以直观了解各主要指标的分布情况。计算均值、中位数、置信区间等,进行结果的合理推断。
Kaplan-Meier曲线

根据给定的参数，对一次完整模拟过程的数据采用Kaplan-Meier方法估计生存分布并绘制曲线。

示例图

基于Python的生存分析工具集 by Lokyshin