中国循证儿科杂志 ›› 2024, Vol. 19 ›› Issue (1): 31-35.DOI: 10.3969/j.issn.1673-5501.2024.01.006
朱雪梅1,4 陈申成2,4 章莹莹1 陆国平1 叶琪2 阮彤2 郑英杰3
ZHU Xuemei1,4, CHEN Shencheng2,4, ZHANG Yingying1, LU Guoping1, YE Qi2, RUAN Tong2, ZHENG Yingjie3
摘要: 背景 科学、有效地预测重症感染患儿死亡关联因素对降低儿童病死率意义重大。既往重症患儿的病情与死亡关系多采用评分预测(如PCIS等),准确度欠佳。 目的 通过机器学习联合特征筛选的方法,挖掘对重症感染患儿死亡风险具有早期预警作用的敏感指标。 设计 队列研究。 方法 基于全国20个省级行政区域的54家PICU的儿童多中心感染性疾病协作网数据库,纳入年龄>28天至18岁、确诊感染和至少有1个器官发生功能障碍的患儿,统计122项临床特征信息,以出PICU时死亡/恶化或治愈/好转为结局,通过机器学习构建逻辑回归模型(LR)、随机森林模型(RF)、极端梯度提升树(XGB)和反向传播神经网络(BP),筛选重要的临床特征建立重症感染患儿死亡风险预测模型。 主要结局指标 模型接收者操作特征曲线下面积(AUROC)和模型筛选临床特征性能的优劣。 结果 2022年4月1日至2023年12月31日协作网数据库中入PICU时确诊重症感染且入PICU时、入PICU 24 h时和出PICU时临床特征记录均完整的(病例1 738例,经过数据预处理包括异常值处理、缺失值填充、强制值区间范围检验、归一化处理)1 738条信息进入机器学习构建模型。存活或好转患儿1 396例,死亡或恶化患儿342例(19.6%)。队列数据按4∶1分为训练集(1 390条)和验证集(348条),训练集中存活或好转1 116条,死亡或恶化274条;验证集中存活或好转280条,死亡或恶化68条。在训练集中,共输入模型122个临床特征,经过机器模型学习以及特征筛选后,在50轮的5折分层交叉验证下,验证集LR、RF和XGB的AUROC为0.74~0.78。LR、RF和XGB选择重要性大于均值的临床特征构建最优临床特征,尚无比较好的衡量BP特征重要性的方法,LR模型较RF和XGB构建的最优临床特征较为接近临床预期。 结论 机器学习预测儿童重症感染性疾病死亡/恶化结局表现一般,预测模型筛选的临床特征与临床预期尚有距离。