AI交易大赛:DeepSeek和Grok表现最佳
快速阅读: 人工智能研究平台nof1推出Alpha Arena交易测试,六款AI模型参与,DeepSeek和Grok回报率超14%领先,Gemini 2.5 Pro亏损42.57%。测试旨在验证AI应对实时金融市场的能力,早期模型抓住市场反弹机会,但长期表现及危机应对能力仍需观察。
专注于金融市场的人工智能研究平台nof1于10月18日推出了一项大型语言学习模型(LLM)交易测试,名为Alpha Arena。此次测试中,六款主流AI模型(GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1和Qwen3 Max)各自在Hyperliquid加密货币交易所使用1万美元真实资金进行交易,所有模型接受相同的提示和输入数据。
实验结束时,DeepSeek和Grok的回报率均超过14%,位列前两名。相比之下,Gemini 2.5 Pro亏损了42.57%。
Alpha Arena交易结果。来源:nof1
与模拟回测或纸上谈兵不同,Alpha Arena完全自主且实时运行,衡量每个模型的净盈亏。所有“参赛者”交易的都是最热门的资产,包括比特币(BTC)、以太坊(ETH)和瑞波币(XRP)。统一的提示确保所有模型从同一基准开始,减少了基于指令的偏差。
早期领先者DeepSeek和Grok采取了积极的多头仓位,利用了市场反弹的机会。相反,ChatGPT和Gemini混合使用多头和空头仓位,表现不佳。
总体而言,Alpha Arena是首次大规模公开测试,旨在验证人工智能系统是否能够真正解读并应对实时金融市场。值得注意的是,在比特币价格剧烈波动期间,多个模型成功识别并抓住了短期反弹机会。
因此,该实验为大型语言模型如何处理高不确定性金融环境提供了宝贵的见解。然而,必须指出的是,1万美元的投资组合和48小时的时间窗口无法充分展示长期表现。同样,这些模型尚未经历极端市场情况,其危机应对能力仍待检验。尽管如此,实验结果为开发者提供了许多思考方向,关于如何通过AI工具提高交易效率以及解决人为监督问题。
(以上内容均由Ai生成)