研究人员使用机器学习来预测运动依从性
快速阅读: 据《科学日报》最新报道,博士生李承柏、崔柱弼与教授康民秀利用机器学习分析超3万份数据,探讨预测体力活动模式。研究发现久坐时间、性别和教育水平是关键因素。虽有主观数据限制,但此方法可改进未来健康建议,助力设计持久锻炼方案。
李承柏和崔柱弼,两位均为体育教育专业的博士生,以及健康、运动科学与娱乐管理系运动分析学教授康民秀,希望借助人体测量数据、人口统计特征及生活方式,预测一个人是否符合体力活动指南。他们已分析了约三万份调查数据。为了高效处理庞大数据集,他们采用了一种名为机器学习的技术,这种方法能够利用计算机识别模式并基于信息进行预测。
康民秀指出,该研究小组的成果发表于《自然》期刊旗下的《科学报告》,具有很高的时效性。他表示:“鉴于体力活动与疾病预防和整体健康模式之间的联系,遵循指南的体力活动与公共卫生紧密相关。”“我们希望通过高级数据分析技术,例如机器学习,来预测此类行为。”
美国卫生与人类服务部下属的疾病预防与健康促进办公室建议,成年人每周至少应进行150分钟中等强度运动,或75分钟高强度运动,作为健康生活方式的一部分。然而,研究表明,平均每位美国人每周仅花两个小时从事体力活动——仅为推荐时间的一半。
李承柏、崔柱弼和康民秀使用了国家健康与营养检查调查提供的公开数据,这是由政府赞助的一项覆盖2009年至2018年期间的调查。
作为本研究的第一作者,崔柱弼称:“我们的目标是利用机器学习,依据问卷数据预测人们是否遵循体力活动指南,并找出最精准预测所需的变量组合。”“性别、年龄、种族、教育水平、婚姻状况和收入等人口统计学变量,以及BMI和腰围等人体测量指标都被纳入考量范围。”
研究人员还考虑了包括饮酒、吸烟、就业、睡眠模式和久坐行为在内的生活方式因素,以了解这些因素对个人体力活动的影响。
结果显示,在所有预测运动习惯的最佳模型中,三个关键因素——一个人坐着的时间、性别和教育水平——始终是重要因素,尽管每个模型确定的重要变量不尽相同。
崔柱弼表示,这些因素对于理解谁更有可能保持活跃并维持社交联系尤为重要,它们或许有助于指导未来的健康建议。
“我原以为性别、BMI、种族或年龄等因素会在我们的预测模型中占据重要地位,但教育水平的重要性让我感到意外,”他说,“虽然性别、BMI和年龄等因素更内在地与身体相关,但教育水平是一个外部因素。”
在分析过程中,研究人员剔除了患有某些疾病的人的数据以及缺少体力活动数据的回应,这使相关数据缩小至11,683名参与者。
研究人员表示,机器学习为他们提供了更大的研究自由度,传统的研究方法往往期望事物遵循直线模式,当某些信息过于相似时,其效果不佳。而机器学习没有这些限制,因此可以更灵活地发现模式。
崔柱弼提到:“我们研究的一个局限性在于通过主观方式记录的体力活动数据,其中参与者根据记忆回忆他们的活动。”“人们在使用问卷时往往会高估自身活动量,因此更准确、客观的数据将提升研究的精确性。”
因此,研究人员表示,他们可以在这一领域的未来研究中采用类似方法,但探索不同的因素,包括膳食补充剂的使用、更多地应用机器学习算法或依赖客观数据而非自我报告的信息。这或许可以帮助教练和健身顾问设计出更能长期坚持的锻炼方案。
(以上内容均由Ai生成)