hga038客户端最新版 hga038客户端最新版 hga038客户端最新版

基于SEER数据库的临床预测模型轻松发3分SCI

今天继续给大家分享一篇临床预测模型文章,也是基于SEER数据库的预测模型,发表于2019年11月Annals of Translational Medicine (IF=3.689)。

总的来说,文章的套路清晰,易于学习和模仿。

标题:年轻胃癌患者预后列线图的开发和验证

标题:年轻胃癌患者预后预测模型的建立和验证

回顾研究的临床预测模型_二语习得中的母语迁移研究——回顾与反思_有效性研究 临床

文章概述:

作者在 SEER 数据库中搜索了 2004 年至 2015 年胃癌患者的数据,包括 549 名详细信息且年龄 <45 岁的患者。将 549 名患者分为训练集 (n=276) 和验证集 (n=273)。随后,对训练集进行单变量 COX 回归和多变量 COX 回归,最终确定与预后独立相关的风险因素(本文研究了 OS 和 CSS)。基于独立风险因素建立列线图并进行验证和评估。文章的总体流程如图1所示。

图 1. 文章的整体流程

文章结果总结如下:

回顾研究的临床预测模型_二语习得中的母语迁移研究——回顾与反思_有效性研究 临床

01

患者基本信息

作者概述了研究队列 (n=549) 中包括的患者的基本信息。这些包括性别、种族、组织学分级、TNM 分期、常见位置和 SEER 分期。同时,作者利用X-tile软件确定了Age和Size的最佳截断值,并根据截断值将患者分为3组。(注:X-tile的具体介绍和使用见文末)

02

回顾研究的临床预测模型_有效性研究 临床_二语习得中的母语迁移研究——回顾与反思

建立预测模型

首先,作者使用单变量 COX 回归分析确定了与 OS 相关的因素。那么,P中的单因素

图 2. 操作系统列线图

图 3. CSS 列线图

回顾研究的临床预测模型_有效性研究 临床_二语习得中的母语迁移研究——回顾与反思

03

验证列线图

在内部验证验证中,OS 列线图的 C 指数为 0.688(95% 置信区间:0.629–0.747),CSS 列线图的 C 指数为 0.785(95% 置信区间:0.735–0.835)。在独立队列的外部验证中,OS 和 CSS Nomogram 的 C 指数分别为 0.633(95% 置信区间:0.579–0.687)和 0.733(95% 置信区间:0.686–0.780)。作者还建立了 3 年和 5 年 ROC 曲线并描述了其对应的 AUC 值,均表现出良好的区分度(AUC:0.725-0.793),如图 4 所示。此外,作者建立了 3 年和5年校准曲线,结果显示列线图预测的存活率(包括OS和CSS)与实际存活率具有较高的一致性,如图5所示(本次推送仅展示OS结果),CSS 类似)。最后,通过DCA结果,研究发现Nomogram显示出与TNM和SEER分期相当的临床适用性。并且在 OS Nomogram 优于 TNM 和 CSS Nomogram 优于 SEER 阶段,见图 6。

图 4. ROC 曲线

二语习得中的母语迁移研究——回顾与反思_有效性研究 临床_回顾研究的临床预测模型

图 5. 校准曲线 (OS)

图 6. DCA 结果

作者结论:本文建立了年轻胃癌患者OS和CSS的预后预测模型回顾研究的临床预测模型,并通过SEER数据库进行了验证。通过统计分析+R语言技术建立了具有较强临床适用性的列线图。通读文献后,初学者可能会对其中的一些内容产生疑惑。相信大家最想问的就是为什么单因素P<0.2会包含在多元分析中,一般不都是0.05吗?? ? 作者这样做是有道理的,有很多文献支持这种做法。2008 年,肿瘤学权威期刊 Journal of Clinical Medicine 发表了一篇详细介绍 Nomogram 的文章,其中指出,Nomogram 中包含的变量应取决于临床数据和临床证据的可用性,而不是统计显着性(参考文献 2)。此外,样本量的限制也可能导致一些变量在单变量COX回归中显示P>0.05,而在多元COX回归中可能P>0.05

另外,很多人可能对X-tile软件不熟悉。我第一次接触到这个软件后,就爱不释手了。它对生存分析的数据处理有很大的影响。X-tile 是耶鲁大学开发的一款单功能小软件。其详细介绍于2004年发表在国际肿瘤学杂志《Clinical cancer research》上,见参考文献3。通俗地说,它可以将一个连续变量截断为2或3类甚至多类,并选择最佳cut-off价值。这个临界值可以将研究对象分成几组,几组之间的生存趋势差异最大。例如,在这篇文章中年龄与患者预后的关系中回顾研究的临床预测模型,很多小伙伴会说,直接把年龄当成连续变量来分析,这也是对的。然而,年龄与结果的关联不是线性的,并且分类变量比连续变量在临床上更易于操作。所以,这个时候,X-tile就可以大显身手了。它可以找到一个最佳的年龄截止值,将患者分成3组,最大限度地提高3组之间生存模式的差异。