http://jkbshare.183read.cc/article/5955917/5.html?t=174338426319554
近日,清华大学附属北京清华长庚医院眼科中心黄天荫教授、王亚星副教授,与多个单位的专家携手,基于亚洲人数据集,共同发表了一项关于基础模型(Foun-dation Model)泛化能力的重要研究成果。文章近期发表在《新英格兰医学杂志·人工智能》(NEJM AI)上。
近年来,基础模型为医学人工智能的开发提供了新路径。传统医学人工智能模型构建通常面临数据收集量大、标注成本高的难题,而基础模型先在大量无标注数据上进行预训练,然后通过微调即可适用于各类下游任务,无须从头训练。此前发表在《自然》(Nature)杂志上的RETFound就是此类模型代表。然而,这类基础模型能否真正适用于其他群体,目前仍不明确。
黄天荫教授等开展的该项研究,基于亚洲人群数据,从青光眼诊断、冠心病诊断、3年内脑卒中发生风险预测3项任务出发,研究了基础模型在不同群体中的适用性。研究团队选取基于大规模视网膜图像预训练的RETFound基础模型和传统的Vision Transformer模型进行比较,以评估前者在亚洲人群数据上的表现。
结果显示,当使用完整数据集微调时,RETFound并未在性能上超越传统Vision Transformer。无论是在青光眼诊断、冠心病诊断还是脑卒中发生风险预测中,两者的表现差异均无统计学意义。在仅使用不超过完整数据集25%的数据进行微调时,RETFound具有微弱优势,但同样无统计学意义。研究结果表明,基础模型与传统模型在泛化能力上面临相似的挑战,尤其是在数据多样化上存在局限性。
研究人员表示,尽管RETFound模型整体潜力较强,若要在特定人群与场景中实现理想效果,仍需更丰富、多元的训练数据支持。医学基础模型若未能在更加多样化的数据集上进行训练,并在各种临床环境中进行测试,其对不同人群和临床情境的泛化性和适用性将受到显著限制。
研究人员在文章中强调在全球范围内加强医学基础模型合作研究的重要性。在当前医疗基础模型的开发中,确保数据来源的多样性,以及推动全球范围的研究协作是应对这一挑战的关键。研究人员同时指出,通过引入更加多元的数据集来提升模型的普适性和公平性,有助于医学基础模型在各类医疗场景中发挥更大价值,为全球医疗服务的智能化和精准化提供有力支持。
王亚星副教授、北京航空航天大学王晓飞教授、新加坡国立大学覃宇宗教授为论文共同通讯作者。 (韩冬野)
北京清华长庚医院APP
快速挂号