通过离线强化学习实现具有协同设计机制的交互式符号回归

发布时间:2025年4月26日    来源:szf
通过离线强化学习实现具有协同设计机制的交互式符号回归

快速阅读: 据《Nature.com》最新报道,研究提出Sym-Q算法,通过序列决策和协同优化机制,显著提升符号回归的泛化能力和效率,尤其适用于非分布内方程结构。与现有模型相比,Sym-Q在多个基准数据集上表现出色,并能有效整合专家知识,适用于更复杂方程及更高维场景,未来可进一步扩展和优化。

这项研究提出了一种先进的大规模符号回归范式,通过明确将其构建为一个序列决策任务,并采用提出的Sym-Q算法来解决。Sym-Q不仅擅长从零开始发现符号表达式,还克服了传统符号回归模型的一个关键局限性:由于有限的泛化和外推能力,它们在整合人类先验知识时效果较差且效率较低,尤其是在面对非分布内方程结构时。为了解决这一挑战,Sym-Q集成了一个协同优化机制,使表达式的交互式细化更加高效。这种创新方法允许领域专家提供部分定义的表达树,促进与模型的实时互动。通过动态修改生成的节点或提供先验信息,专家可以更有效地引导代理开发出精准捕捉潜在问题动态并符合已建立物理定律的数学表达式,特别是当部分领域知识可用时。这种协同优化机制有效地整合了专家见解和用户假设,提高了结果表达式的可解释性和科学相关性。

Sym-Q的关键优势之一在于其多功能性,它可以与各种类型的编码器结合使用,从先进的Transformer架构到更简单的RNN,用于处理表达树——从而区别于先前的研究。通过利用强化学习(RL),Sym-Q避免了暴露偏差,通过逐步引导模型构建方程。它不是记忆标记序列,而是基于观察动态生成表达式,显著减少了教师强制模型中固有的训练与测试不一致问题。这种结构化学习方法使Sym-Q能够更好地泛化并更有效地适应未见过的方程。

为了实现有意义且公正的评估,我们将Sym-Q与三种最先进的基于Transformer的监督学习模型进行了比较,这些模型像Sym-Q一样没有包含额外的在线搜索机制。广泛的基准评估表明,Sym-Q在大多数用于预训练大规模符号回归模型的基准数据集上与其他最先进的算法在拟合准确度和恢复率方面表现相当。这个创新框架特别适合协同设计,实验表明Sym-Q的协同优化机制行之有效。通过整合领域知识,Sym-Q有效处理复杂情况,如在费曼数据集中恢复漂移项以及从合成过境光谱中推导分析表达式。这种整合导致恢复率和决定系数均有显著提高。我们的实验表明,随着更多领域专业知识的融入,协同设计方法不仅提升了性能指标,还使模型输出与潜在的物理定律和模式保持一致。与NeSymReS相比,Sym-Q的协同优化机制始终展现出更可靠的改进,在不同程度的真实值可用性下有效利用了部分信息。

除了当前的性能提升,Sym-Q的协同设计能力推动了符号回归领域的重要进展,特别是在涉及非分布内方程结构的场景中。通过有效地利用部分先验知识并动态适应不熟悉的方程形式,Sym-Q展示了强大的泛化和适应能力,成为解决复杂现实世界问题的强大工具。

未来研究的一个有前景的方向是将Sym-Q扩展至处理更复杂的表达式类型,例如常微分方程和偏微分方程。此外,对协同优化框架的进一步改进可以探索更复杂的方式整合专家知识,可能包括综合约束条件或分层指引以进一步完善发现过程。虽然我们已经验证了Sym-Q从两个变量到三个变量的可扩展性,但将模型拓展至更高维度仍然是未来研究的重要方向。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日