文/陈根
机器学习是人工智能领域最为广泛的应用之一。机器学习是统计分析时代向大数据时代发展必不可少的核心打磨,是开采大数据这一新“石油”资源的工具。
比如,在基础应用领域,环境监测、能源勘探、天气预报等基础应用领域,通过机器学习,加强传统的数据分析效率,提高预报与检查的准确性;再如销售分析、画像分析、库存管理、成本管控以及推荐系统等商业应用领域。
此外,在疾病预测方面,机器学习也越来越多地为人们提供可靠的帮助。疫情期间,研究人员就曾通过机器学习来预测新冠肺炎患者的生存率。2020年3月,来自华中科技大学同济医学院附属同济医院、华中科技大学人工智能与自动化学院、剑桥大学植物科学学院的研究人员利用了可解释机器学习算法,对预测新冠肺炎患者存活率的生物标志物进行了揭示。
研究人员对武汉同济医院收治的404例新冠肺炎感染患者进行血液样本数据收集并进行回顾性分析。通过机器学习工具,研究团队最终选择了3种生物标志物来预测个体患者的生存率,准确性超过90%:LDH(乳酸脱氢酶)、淋巴细胞和hs-CRP(超敏C-反应蛋白)。特别是,仅LDH水平较高这一项指标就能够用于区分绝大多数需要立即就医的病例。
现在,柏林夏里特医学院的研究人员也成功通过一个机器学习模型利用血浆蛋白来预测新冠肺炎患者的生存率,而这要比结果早几个星期。
具体来看,在新研究中,研究人员分析了在349个时间点采集的血样中321种蛋白质的水平,这些血样来自德国和奥地利的两个独立医疗中心正在治疗的50名新冠肺炎重症患者。随后,通过特定的机器学习方法被用来寻找所测量的蛋白质和病人生存之间的联系。
队列中的15名患者死亡;从入院到死亡的平均时间为28天。对于活下来的病人,住院时间的中位数是63天。研究人员确定了14种蛋白质,随着时间的推移,与在重症监护下无法存活的病人相比,存活的病人的蛋白质变化方向相反。
研究小组随后开发了一个机器学习模型,根据相关蛋白质的单一时间点测量来预测生存率,并在24名COVID-19重症患者的独立验证队列中测试了该模型。该模型在这个队列中表现出准确的预测能力,正确预测了19名患者中的18名生存者和5名死亡者的结局。
机器学习进入人们的生活已经是不争的事实,随着技术水平的不断提高,机器学习将越来越多地为人们提供人力所难及的支持,对于此次机器学习展现出来的成绩,研究人员总结说,如果在更大的队列中得到验证,血液蛋白检验可能有助于识别具有最高死亡风险的患者,以及检验某种治疗是否会改变单个患者的预测轨迹。
?原文标题:陈根:血液测试,如何预测新冠感染存活率??