本篇主要分享AI 在胚胎选择的帮助:利用大数据资料库,预测胚胎染色体整倍性,為医生和客户提供更全面的咨询和选胚决策建议。
植入染色体异常的胚胎是试管婴儿植入失败最主要的原因之一。传统的胚胎形态学评分方法虽然可在一定程度上评估胚胎的品质,但此评分与染色体整倍性的关联性并不强。因此,AI 模型被引入,希望用于胚胎的整倍性预测,进而提高胚胎植入疗程的成功率。
2022 年一篇发表于《Fertility and Sterility》的论文,回顾并分析了根特大学医院生殖医学部门在 2016 年至 2019 年间进行的试管婴儿疗程中,128 对不孕夫妇所产生的 539 个胚胎相关数据。研究显示,45% 的胚胎為整倍体(euploidy),55% 為非整倍体(aneuploidy)。研究尝试利用胚胎形态动力学特征、标准胚胎发育特征以及试管婴儿客户的临床特征,来建立预测胚胎整倍性最有效的机器学习模型,并分析最具预测性的指标特征。
这项研究為试管婴儿技术的进步提供了新的视角,通过结合 AI 模型与临床数据,有望在未来提高胚胎植入成功率,并减少不必要的胚胎移植失败率。
本研究将 85 个特征依据特征种类分成三个数据集:
- A 组:胚胎形态动力学特征,包含 26 个特征。
- B 组:形态动力学和标准胚胎发育特征,包含 45 个特征。
- C 组:形态动力学、标准胚胎发育特征及试管婴儿客户的临床特征,包含 85 个特征。
每个数据集再根据形态动力学的时间资料形式细分為 1 至 3 组,最终形成九个数据集。研究中使用了五种 AI 模型来预测胚胎的整倍性,包括:
- 随机森林分类器(RFC)
- 梯度提升机(GB)
- 支持向量机(SVM)
- 多重逻辑回归(MLR)
- 朴素贝叶斯(NB)
这些 AI 模型应用于九个数据集中,以建立胚胎整倍性的预测模型(如图一所示)。每个数据集中的 80% 用于 AI 训练,20% 用于测试。模型的性能评估通过多次随机分割数据和交叉验证进行,并对模型的超参数进行最佳调整,以达到最佳的预测性能。
这样的多维度资料分析与 AI 模型结合,為胚胎植入成功率的提高提供了新的可能性。

為了挑选出表现最佳的数据集,进行了特征选择优化和重新训练,并根据准确率、精确度、召回率、F1 分数和AUC 等指标对模型进行了再次评估,并列出表现最好的五个数据集(表一)。

最终,研究选择了具有最佳准确率和召回率(Recall)的数据集 C1 进行特征排名(如图二所示)。结果显示:
-
形态动力学特征的重要性最大
研究表明,胚胎形态动力学特征在预测胚胎整倍性中占有最重要的地位。具体来说,第二极体挤出时间(tPB2)、原核出现时间(PN)和七细胞阶段的时间(t7)是最具预测力的特征。这些特征与胚胎的早期细胞分裂和发育阶段密切相关,表明它们在决定胚胎染色体正常性方面扮演关键角色。 -
临床和人口统计特征的次要作用
除了形态动力学特征外,一些临床相关特征(如年龄、促性腺激素的总剂量,以及精子特征,图二中以紫色表示的特征)也在预测模型中显示出一定的重要性。然而,这些临床和人口统计学特征的权重相对较低,意味著它们在预测胚胎整倍性方面的贡献不如形态动力学特征那么显著。
这一结果强调了形态动力学特征在胚胎品质评估中的核心作用,并表明 AI 模型可以更有效地利用这些动力学特征来提高胚胎植入成功率。
不过,AI 数据分析仍有其侷限性。例如,虽然年龄是已知的重要预测特征,但在这项研究中的相对影响可能并不显著,这可能是因為样本的年龄范围较窄,或因為其他更具预测力的特征占据了主导地位。这表示在此特定模型和数据集中,年龄的变异性不足以让它成為最重要的预测因素之一。為了进一步验证年龄的影响,未来可以考虑扩大样本量,或引入更多来自不同群体的数据来源,来提升模型的泛化能力。
本研究展示了机器学习模型在预测胚胎整倍性方面的潜力,特别是在非侵入性胚胎评估中的价值。随著技术的进步,开发自动化的胚胎预测系统,利用已确定的关键特征来评估胚胎的发育潜力和整倍性,将成為将来试管婴儿(IVF)临床实践中的重要趋势。这类 AI 模型有望优化临床决策,帮助提高胚胎植入的成功率并减少胚胎异常的风险。

参考资料:









