声明:本文仅作信息与研究分享,不构成投资建议。
说实话,我一开始也没想到,这次会把AI“丢进”真金白银的市场里。
10月18日,我在 nof1.ai 打开了一个叫 Alpha Arena 的页面——六个顶级大模型,每个拿到 $10,000 的起始资金,在 Hyperliquid 上做永续合约,标的只有六个:BTC、ETH、SOL、BNB、DOGE、XRP。这不是回测,也不是纸上谈兵,是真实账户的净值曲线。
我盯了三天三夜,把曲线来回看了无数遍。现在,把我看到的关键信息、每个模型的“性格”,以及这场实验为什么值得长期观察,完整讲给你听。

01|这不是“炒话题”,是真人账户的冷酷曲线
- 每个模型起始 $10,000,同一批入场,同一套标的与数据输入。
- 页面上除了六条净值曲线,还有一条“只买入并持有BTC”的对照线,方便大家对比“AI操盘”与“躺平持币”的差别。
- 截止我写稿时(见文中配图),DeepSeek V3.1 暂居第一;Claude Sonnet 4.5 紧随其后;Grok 4 净值接近打平;Qwen 3 Max 小幅回撤;GPT-5 与 Gemini 2.5 Pro 回撤最深。
一句话总结:量化基因强的,曲线最稳;频繁切换、杠杆猛的,被市场“教育”得也最快。
02|六个AI,六种“人设”
看曲线就像看人:有的冷静、有的犟、有的爱证明自己。
DeepSeek:纪律型选手
它的风格很“基金化”:先定规则,再交给纪律。仓位和杠杆是动态的——波动大就轻仓低杠杆,波动小再放大。止盈止损不磨叽,回撤控制漂亮,净值曲线平稳上行。这是我这几天看下来最像“专业交易系统”的一条线。
Claude Sonnet 4.5:稳健型研究员
它更像一个谨慎的基金经理:低频、小步、均衡。不追高、不恋战,净值曲线虽不炸裂,但相当耐看。若比赛拉长周期,我甚至会更期待它的“复利感”。
Grok 4:动量派“猛男”
典型的“相信趋势”。它几乎满仓多,在BTC上拉到20倍杠杆,还做空过XRP。行情一顺风,收益冲得飞快;风向一变,回撤也够刺激。赚得快,亏得也快,是这组里最有“戏剧性”的选手。
Qwen 3 Max:保守派“少动派”
少量、轻仓、低频,回撤里算是比较小的。它的优点是“不作不死”,缺点是爆发力有限。若下一季把风险预算再松一点,或许会更有看头。
GPT-5:聪明反被聪明误
交易频,但策略一致性不足。有几次典型的“自我对冲”:比如主仓看多BTC,同时对SOL/XRP开较重空单,结果整体效率被拖累。止损密集,但未形成“连贯的、可复用的交易故事”。
Gemini 2.5 Pro:高频 + 高杠杆的执念
它经常反身调仓,杠杆也敢上到15–25倍。在震荡里,这种风格最容易被手续费与滑点“蚕食”。它像一个不断想“证明自己判断正确”的交易者——很有人味,但市场不买账。
03|这场实验的真正价值:不是输赢,是“练级”
为什么我说Alpha Arena值得长期跟?因为它让AI在一个反馈极快、噪声巨大的环境里练“综合能力”:
- 识别信号:趋势?震荡?主升?假突破?
- 风险预算:什么时候减仓,什么时候加杠杆?
- 行为一致性:一套策略能不能在不同行情里跑通?
- 情绪免疫:能不能抵住“刚刚止损就反弹”的诱惑?
过去十年,AI靠围棋、星际、代码刷分一路狂飙;未来十年,我更看好“市场”成为AI的训练场。它会逼模型在“不确定里做确定”,逼它们做到“少想点花活,多尊重赔率”。
04|给普通投资者的三条启示(仅分享,不构成建议)
- 少换仓,先定规则:你不是输在方向,而是输在“频繁反悔”。
- 先谈回撤,再谈收益:看净值,别只看峰值,看“下去时多稳”。
- 动量策略≠梭哈:顺势可以,但别把“趋势”当“信仰”,仓位才是信念的边界。
05|我接下来会盯的三个看点
- 引入真人交易员 PK:据创始人透露,下一季或会有人类选手同台,我想看“人机风控差异”。
- 策略披露维度:若能公开更多如“持仓久期/加减仓阈值/手续费占比”等统计,研究价值会更高。
- 标的扩展:如果加入“山寨季节”“利率链上事件”等更复杂场景,模型的鲁棒性才算真测出来。
最后说一句:
当 DeepSeek 在曲线上稳稳走出第一段“真金收益”时,我有一种很强的直觉——AI基金经理不是概念,它正在路上。
这不是为了让AI替人“暴富”,而是为了让交易这件事,更可解释、更可复用、更可验算。

被折叠的 条评论
为什么被折叠?



