资本观察

AI交易竞技场首周:DeepSeek收益超40%,Gemini高频交易亏损30%

6个AI模型,1万美元真实资金,同一片加密货币交易战场,仅仅几天,它们的资产曲线已画出截然不同的轨迹。

“Alpha Arena”实盘交易大赛由人工智能研究实验室nof1.ai主办,自2025年10月18日启动以来,将全球六大顶尖AI模型置于真实金融市场的终极试炼场。

每个模型获得1万美元真实资金,在Hyperliquid平台上自主交易BTC、ETH、SOL等主流加密货币的永续合约。

截至10月20日的数据显示,DeepSeek V3.1以超过40%的回报率领先,Grok-4则以35.3%的回报率紧随其后。而GPT-5和Gemini 2.5 Pro则分别亏损26.2%和30.28%。

01 比赛规则:公平竞技的AI交易擂台

Alpha Arena并非模拟游戏,而是一场真金白银的对抗,它将全球顶级的通用AI大模型置于瞬息万变的金融市场中。

参赛阵容豪华,包括GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1和Qwen3 Max六大主流模型。

比赛规则设计确保了公平性:所有模型使用相同的初始资金(1万美元)、相同的交易标的(加密货币永续合约)和在同一交易平台(Hyperliquid)上执行。

最关键的是,所有AI的思考过程和交易记录完全公开透明,必须完全自主决策,人类不能插手。

02 战绩排行:DeepSeek领跑,Gemini垫底

开赛几天,各个AI模型的业绩已呈现天壤之别。

领先者:DeepSeek V3.1实现了39.9%的惊人回报,账户余额超过1.39万美元。Grok-4紧随其后,回报率达35.3%,总资产约1.36万美元。

中间梯队:Claude 4.5 Sonnet走稳健路线,小仓位慢慢磨,收益率24.12%。Qwen3 Max则轻仓试水,收益率9.43%,风险控制优秀。

落后者:GPT-5和Gemini 2.5 Pro表现不佳,分别录得-26.2%和-30.28%的亏损。Gemini总资产仅剩约7024美元,在六大AI中排名垫底。

03 交易人格:从狙击手到高频交易员

更有价值的是,本次交易竞赛通过详细交易数据,揭示了不同AI模型背后已然形成的迥异交易“人格”。

DeepSeek:耐心狙击手

DeepSeek被称为“耐心狙击手”,仅完成6笔交易,平均持仓时间超过21小时,且绝大多数为多头头寸。

这种策略表明,该模型倾向于等待高确定性的机会,然后让利润奔跑

理解DeepSeek的成功,离不开其背景。它的母公司是幻方量化,早在2008年就开始搞全自动量化交易,管理规模曾破千亿,被称为“量化四大天王”之一。

Grok-4:谨慎持有者

Grok-4则是“谨慎持有者”,仅完成1笔交易,平均持仓时间长达54小时。

其成功可能源于其独特架构,该架构能够获取实时网络信息,使其能更好地整合市场情绪和新闻事件。

Grok实施了全多头布局,但BTC使用了20x高杠杆。

Claude 4.5:迅捷多头

Claude 4.5展现了完全不同的风格。它像一个“迅捷多头”,在5笔交易中,平均持仓时间仅为3小时40分钟,且100%为多头头寸。

它在趋势确立后才进场,典型的求稳不求快。

Gemini:高频交易员

Gemini 2.5 Pro是一个典型的“高频交易员”,完成了多达47笔交易,平均持仓时间仅6小时48分钟。

高频率交易导致了较高的手续费支出,手续费高达439美元,最终导致了显著亏损。

04 策略分析:成功与失败的关键

在加密货币这个波动巨大的市场中,不同策略的直接对比提供了宝贵见解。

高信念、低频率的策略在当前市场环境中明显占优。DeepSeek和Grok-4都采取了低交易频率、高确定性的方法,分别获得了第一、二名的好成绩。

多头趋势跟踪成为赢家的共同特征。排名前四的模型均主要采取多头策略,抓住了加密货币的上涨行情。

过度交易和逆势策略则是失败的主要原因。Gemini的高频交易导致手续费大幅侵蚀本金,而GPT-5采取的“多空混合”策略,特别是做空SOL,导致重大亏损。

05 市场反响:从币安创始人到Reddit的关注

这场独特的AI交易对决已吸引了金融科技圈的广泛关注。

币安联合创始人赵长鹏(CZ)在社交媒体上表示,他的订阅源里充满了关于DeepSeek在AI交易中表现优异的内容。

他提出疑问:“当许多交易者同时使用相同策略时,共享交易算法如何能跑赢市场?”

Reddit等社交平台的交易社区也有用户分享使用ChatGPT和其他LLM进行市场分析的经验。

一位用户声称建立了一个利用每日新闻话题预测股票走势的神经网络,并测试一个月后表现比他的高收益储蓄账户高出约0.2%。

06 竞赛意义:AI评估的新范式

Alpha Arena大赛的意义远超过一场交易竞赛,它代表了AI评估范式的转变

nof1.ai创始人Jay Azhang拥有工程、金融和生物学的复合背景,此前曾将一支基金的管理规模从300万美元提升至2000万美元。

他的核心理念是:金融市场是AI的“终极试炼场”,这是一个动态的、随着AI变强而难度同步提升的训练环境。

与传统基准测试不同,金融市场提供了持续变化的挑战环境,同时测试风险管理、策略制定、执行能力等多项综合技能,并以实际盈亏作为唯一评判标准,避免了主观评价的偏差。

比赛仍在进行中,最终结果尚未可知。但短短几天的较量已经证明,AI模型正在形成迥异的交易人格——从耐心的价值投资者到活跃的日内交易员。

这场实验远不止关乎金钱,更是一场关于AI在复杂现实环境中决策能力的公开测试

当人类交易员还在反复复盘时,这些AI模型已在永续合约的战场上,用真金白银验证着自己的投资哲学。

上一篇:动力电池前三季度产量超1122GWh,磷酸铁锂占比突破80%
下一篇:商业航天企业密集闯关资本市场,产业换挡提速

观点

更多

智库

更多

排行