阿里千问反超DeepSeek夺冠AI投资大赛,GPT-5垫底

发布时间:2025年11月5日    来源:szf
阿里千问反超DeepSeek夺冠AI投资大赛,GPT-5垫底

快速阅读: 阿里千问在六款全球顶尖人工智能大模型参与的实盘投资比赛中,以超过20%的收益率夺冠,DeepSeek位列第二,两款中国模型成唯一盈利者,美国四模型均亏损。

六款全球顶尖的人工智能大模型参与的实盘投资比赛落下帷幕,阿里千问最终反超DeepSeek,夺得冠军。当地时间11月3日下午5点,美国AI研究平台Nof1宣布,自10月18日起举行的大模型实盘投资比赛Alpha Arena正式结束。六位参赛者中,阿里千问Qwen3-Max最终以超过20%的收益率摘得桂冠,DeepSeek v3.1位列第二,其账户金额比第三名高出3000多美元。两款中国模型成为全场唯一实现盈利的大模型,而来自美国的四款大模型则全线亏损,其中OpenAI的GPT-5亏损超过60%,排名垫底。

此次比赛汇集了Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5和xAI的Grok 4这六款全球顶尖模型。比赛中,Nof1为每个模型账户提供了1万美元的启动资金,让它们通过Hyperliquid平台在真实市场自主交易数字货币。整个比赛期间不允许人为干预,这意味着大模型需自行识别买入机会、决定买入仓位、判断买卖时机,并实时管理风险。在此过程中,系统持续向模型提供当前账户状态、持仓情况、市场价格和技术指标等信息,以便模型作出动态决策。

从图表数据来看,六个大模型展现出三种投资风格:“领先派”Qwen和DeepSeek几乎全程占据第一梯队;“震荡派”Claude和Grok则时有起伏;“稳定派”GPT-5和Gemini 2.5 Pro则始终处于低位。比赛结果显示,DeepSeek的表现一贯稳健,历史最高收益率曾达到130%。然而,在比赛临近尾声时,更为激进的Qwen通过一次紧急避险操作成功超越DeepSeek,以超过20%的收益率和12231.82美元的账户总额夺冠。与此同时,GPT-5和Gemini 2.5 Pro的初始本金仅剩约40%。

交易记录显示,Gemini和GPT的买卖频率最高,尤其是Gemini,有时持仓时间仅为几分钟;相比之下,Anthropic的Claude和xAI的Grok则显得较为保守,持仓时间较长,交易次数较少。

Nof1表示,本季比赛旨在探讨“在几乎无人为指导的情况下,大型语言模型(LLM)能否直接作为零样本(zero-shot)系统化交易模型使用”。初步实验表明,即使在相同的运行框架和提示词下,不同大型基础模型在风险偏好、规划能力、方向性倾向(如看多或看空)及交易活跃度等方面仍存在显著差异。此外,团队还注意到,这些模型对提示词的细微变化极为敏感。Nof1透露,下一季比赛即将开启,届时将引入多提示词、多实例及交易历史等机制,以提高模型的稳定性和评估深度。

(以上内容均由Ai生成)

你可能还想读

英财政拨款助力警用科技升级,包括面部识别与无人机应用

英财政拨款助力警用科技升级,包括面部识别与无人机应用

快速阅读: 英国财政部在2024-2025财年提供5550万英镑,四年共2.34亿英镑,资助警察技术投资,内政部推广实时面部识别、无人机、自动化公众联系和人工智能等技术。 英国独立公共支出监督机构表示,在2024-2025财政年度,财政部在 […]

发布时间:2025年11月5日
康奈尔教授开发多感官学习AI系统

康奈尔教授开发多感官学习AI系统

快速阅读: 康奈尔大学安德鲁·欧文斯教授正开发一种能看、听、触的人工智能系统,模仿儿童学习方式,使AI更直观。该研究已产生成果,如为无声视频生成音轨。 ITHACA, N.Y. — 康奈尔大学的一位教授正在开发一种能够看、听、触的人工智能系 […]

发布时间:2025年11月5日
AI不会取代你,但会用AI的人将超越你

AI不会取代你,但会用AI的人将超越你

快速阅读: 首席收入官指出,面对AI兴起,关键在于适应而非恐惧。AI改变任务而非取代人类,学会合作可保职位并扩展职能。 作为一家在科技与教育之间架起桥梁的公司的首席收入官,我经常被问及三个相同的问题:“人工智能会取代我的工作吗?”、“人工智 […]

发布时间:2025年11月5日
工会合同保护工人免受AI威胁,AFL-CIO主席呼吁设立严格监管

工会合同保护工人免受AI威胁,AFL-CIO主席呼吁设立严格监管

快速阅读: AFL-CIO主席莉兹·舒勒强调工会合同是保护工人免受AI滥用的关键,主张将AI转化为对工人有利的工具,同时讨论了教皇利奥十四世支持工人的教学文件。 去年SAG-AFTRA罢工的一个主要问题是人工智能如何被用来破坏艺术。AFL- […]

发布时间:2025年11月5日
也门萨那大学举办AI与信息技术文凭项目评审会

也门萨那大学举办AI与信息技术文凭项目评审会

快速阅读: 萨那大学举办研讨会,审查并完善“人工智能”和“信息技术”专业文凭课程,旨在培养具备必备技能的毕业生,满足劳动力市场需求。校长强调课程提升重要性,质量中心和计算机中心参与其中。 萨那 – 萨巴:周二,萨那大学发展与质量保证中心举办 […]

发布时间:2025年11月5日
比特币矿商CleanSpark拓展AI业务,德州获285兆瓦电力支持

比特币矿商CleanSpark拓展AI业务,德州获285兆瓦电力支持

快速阅读: 比特币矿商CleanSpark扩大电力容量28%,购地271英亩建立人工智能数据中心,确保285兆瓦电力供应,标志业务多元化重要进展,应对能源密集型计算需求增长。 比特币矿商CleanSpark在10月将其电力容量扩大了28%, […]

发布时间:2025年11月5日
微软Teams新功能引发隐私担忧,AI监控员工效率

微软Teams新功能引发隐私担忧,AI监控员工效率

快速阅读: 微软Teams集成办公室位置功能,自动记录用户位置,简化协调并支持AI预订;同时推出基准功能,跟踪用户与AI互动评估技术整合。微软及亚马逊等公司推行返岗政策,引发对员工效率军备竞赛及隐私侵犯的担忧。 位置更新只是众多技术中最新的 […]

发布时间:2025年11月5日
OpenAI发布Sora安卓版,生成超现实视频

OpenAI发布Sora安卓版,生成超现实视频

快速阅读: OpenAI在Android平台发布Sora应用,支持生成超逼真AI视频,需邀请码使用。应用扩展至美、加、日、韩等国,提供社区功能。 在iOS平台推出一个月后,OpenAI终于在Android平台上发布了其Sora应用程序,让更 […]

发布时间:2025年11月5日