车迷们正在使用 AI 来预测 F1 比赛结果,而且该软件只会变得越来越智能
快速阅读: 《Motorsport.com》消息,数据科学家马里亚纳·安塔亚构建了一款机器学习模型预测F1比赛结果,目前已成功预测三场大奖赛的获胜者。她希望通过加入更多数据和特征优化模型,并期待与车队策略工程师探讨。尽管模型准确率逐步提升,但F1比赛中仍存在诸多不可预测因素。
(原英文内容已全部翻译并润色)
大奖赛前夕,许多人都喜欢分享自己的预测或猜测周日谁能胜出。数据科学家马里亚纳·安塔亚将这些对话提升到了一个新的高度,构建了一个机器学习模型,尝试预测F1比赛的结果。截至目前,她的模型已经成功预测了本赛季的三场大奖赛获胜者。
“我是一个非常狂热的F1迷,”安塔亚在接受《赛车运动》采访时说道,“机器学习和所有这些算法在车队中广泛采用。我认为并非所有人都知道,但比赛工程师实时运用这些策略。”
“所以,我想尝试一种趣味性的尝试,预测获胜者,看看我们能利用现有数据做到多好。”
为了做到这一点,安塔亚开始构建自己的模型。她利用去年墨尔本阿尔伯特公园赛道澳大利亚大奖赛的数据(来自FastF1 API数据存储),着手对比2024年的比赛结果与2025年的排位赛表现。一旦安塔亚从程序中排除了菜鸟车手(她承认这是她“调整”的唯一因素,因为没有基准数据可参考),她便开始训练她的模型。利用梯度提升算法,安塔亚预测了墨尔本阿尔伯特公园赛道的比赛圈速,她的程序正确地预测兰多·诺里斯为冠军。
“视频末尾提到过,这显然只是一个简单的模型,我不知道它会预测得如此准确,”安塔亚说道。从那时起,这个项目开始发展壮大,F1社区聚集在一起看安塔亚还能正确预测多少场比赛。
“我希望这成为一种众包性质的东西,”她补充道,“这样所有的观众都可以告诉我‘我真的希望你在模型中加入天气数据’或者‘我真的希望你在模型中加入练习赛’。”
“我希望人们告诉我他们想在模型中添加哪些其他特征,以在整个赛季内优化它。”
F1迷马里亚纳·安塔亚的照片来源:马里亚纳·安塔亚
并且它确实得到了改进,因为机器学习模型继续正确预测比赛赢家。但这并不意味着它是完美的,安塔亚现在正在向程序中添加更多数据点,以帮助提高其准确性。
“拥有更多数据将帮助模型学到更多,并且能够做出更好的预测,”她解释道,“如果你只有少量数据,它的思维能力就会很有限,无法理解那么多。”
为了扩展模型的思维能力,安塔亚在日本大奖赛前添加了天气数据,其中包括比赛中降雨的可能性以及铃鹿赛道的温度。此外,还添加了车手在湿滑天气下的表现数据,程序利用这些数据正确预测了马克斯·维斯塔潘在比赛中的胜利。
模型的下一个重要步骤是在本周末的沙特阿拉伯大奖赛之前,当时它根据今年每支车队的表现进行了训练。安塔亚解释说,这一额外的数据线将帮助她的程序理解迈凯伦和威廉姆斯等车队在2025年取得了进步,而像红牛这样的车队则不像2024年那样表现稳定。
“我们现在正在考虑更全面地了解赛车和车队的表现,”她解释道。
对系列文章感到惊讶
Instagram和TikTok上的这一系列帖子越来越受欢迎,每次上传后关注度都在增加,甚至吸引了F1本身的关注。据报道,在安塔亚开始上传后,一些车队的首席策略工程师联系了她,她现在正期待着发现自己的预测模型与系列中使用的预测模型有多接近。
“我对反响感到惊讶。我真的非常惊讶,”她说,“我真的不知道[车队是如何实现的]。对我来说这是一个黑箱,我希望我能知道。但我希望我是正确地做或者类似的事情。他们肯定使用了更加复杂的模型和更多的关于赛车的数据。”
汉娜·施密茨,红牛车队首席策略工程师的照片来源:彼得·福克斯 – 盖蒂图片社
在五场大奖赛中有三场正确预测出获胜者,安塔亚并没有因此而满足,她希望让预测器更加准确。在迈阿密大奖赛之前,这位数据科学家表示她想要开始试验更复杂的机器学习过程,以提高预测的准确性并减少模型的平均绝对误差,后者可以被视为模型预测与比赛结果之间的平均差异。
然而,尽管由于新增的数据点和新流程的实施,模型的准确性可能会提高,但安塔亚意识到在F1中总会有一些不可预测的因素。
“我认为总会有那个障碍,”她补充道,“很难告诉这一圈会有安全车出现,而这又会触发一系列其他事件。”
“也许我们可以拉取比赛期间的撞车概率历史数据,并将其作为另一个特征添加。但这也是一项运动,所以我们不能总是预知未来发生的一切。”
阅读更多:F1马克斯·维斯塔潘似乎厌倦了,但不是对红牛
F1刘易斯·汉密尔顿在粉丝商店开业时让伦敦陷入停滞
本文作者欧文·贝尔伍德
F1成为第一个知道的人并订阅这些主题的实时新闻邮件提醒订阅新闻提醒
成为第一个知道的人并订阅这些主题的实时新闻邮件提醒
将文中的英文单词都翻译成中文,最终的内容只输出中文,装备名称、人名地名、公司名称都翻译成中文,最后将语句再润色一下,使得前后文更加的通顺,让语句更加的生动,将最后的输出文本的格式看起来更美观,除此之外,不要提供任何解释文字
(以上内容均由Ai生成)