高通量分析方法(如基因组学或成像)加速了基础研究进程,而这些方法为涉及疾病表型的基因、分子途径和细胞类型。机器学习(ML)是从高维数据集中提取疾病相关数据的有用工具。近日,科罗拉多大学医学院Casey Greene展望研究了罕见病中的机器学习。
本文要点:
1)根据生物学问题的复杂性,机器学习通常需要许多样本来识别重复出现的和具有生物学意义的模式。而罕见病在临床病例中固有的局限性,导致可供研究的样本很少。
2) 从这个角度来看,作者概述了将ML用于小样本集的挑战和新兴解决方案,特别是在罕见病中。罕见病ML方法的进展会为罕见病以外的应用提供重要信息,因为罕见病的样本很少有高维数据。支柱建议方法界优先发展用于罕见病研究的ML技术。
Jineta Banerjee et.al Machine learning in rare disease Nature Methods 2023
DOI: 10.1038/s41592-023-01886-z
https://doi.org/10.1038/s41592-023-01886-z