应用机器学习算法和 Shap 解释预测索马里育龄妇女的生育偏好
快速阅读: 据《Nature.com》称,一项研究利用机器学习和SHAP技术,分析索马里女性生育偏好,发现年龄、教育、生育次数等因素影响显著。结果有助于制定生殖健康政策。
记者获悉,一项最新研究利用机器学习算法和Shapley加性扩展(SHAP)技术,识别出索马里育龄女性生育偏好的关键预测因素。这项研究基于2020年索马里人口与健康调查(SDHS)的数据,涵盖8951名15至49岁的女性。
研究将“生育偏好”分为两类:希望多生孩子或不再生育。预测变量包括年龄、教育程度、生育次数、财富状况、居住地以及距离医疗机构的距离等社会人口学因素。
结果显示,随机森林算法在预测性能上表现最佳,准确率达到81%,精确率为78%,召回率为85%,F1分数为82%,受试者工作特征曲线下的面积(AUROC)为0.89。
SHAP分析进一步揭示了影响生育偏好的最重要预测因素,依次为年龄组、地区、过去五年内的生育数量、已生育子女数量、婚姻状况、财富指数、教育水平、居住地及距离医疗机构的距离。特别是,45至49岁的女性和生育次数较多的女性更倾向于不再生育。此外,距离医疗机构较远成为一个重要障碍,就医便利程度较高则更可能希望多生孩子。
研究强调,通过识别这些关键的社会人口学决定因素,可以为制定基于证据的生殖健康干预措施提供重要参考。未来的研究将进一步拓展机器学习在纵向数据中的应用,并考虑更多的文化和心理社会因素,以提高模型的稳健性和适用性。
(以上内容均由Ai生成)