马斯克融来的 60 亿美元巨资,让 xAI 弯道超车,估值一跃成为全球第二大 AI 独角兽。但马斯克在 AI 行业内积累的人望,以及此刻大模型创业之激烈,他的入局远远谈不上众望所归。而 xAI 由此被拉起的高昂估值,也未必不会成为一场 “纸面富贵”。
作者 | 董温淑
来源 | 市界
全世界对 OpenAI 情感最复杂的,非马斯克莫属。积累了 10 年的恩怨情仇,从蜜月到对簿公堂,马斯克终于下定决心,亲手承担起 “干翻 OpenAI” 的使命。
5 月 27 日,马斯克宣布:其创办的大模型公司 “xAI” 完成了 60 亿美元的 B 轮融资,市场估值达到 240 亿美元 —— 这已是目前 OpenAI 约 800 亿美元估值的三分之一。
能一夜之间为 xAI 拉满血条,除了马斯克身上的创业光环,还有他自信能稳定地获取英伟达的芯片。
5 月,在社交媒体 “X”(此前名为 Twitter)的路演活动上,马斯克对投资者宣布:xAI 目前正在约 2 万颗英伟达 H100 芯片上,训练自家大模型 Grok 2.0。未来,他要建造一座 “计算超级工厂”,用 10 万颗英伟达 H100 GPU 芯片,训练 Grok 3.0。
在这位全世界最任性,创业也最不计成本的老板支持下,成立虽不满一年,xAI 一夜便挺进到了巨头行列,变身为全球 AI 第二大独角兽。
▲(5 月 23 日,在巴黎 “欧洲科技创新展览会” 上,马斯克在视频连线上再次怒怼 OpenAI)
虽然马斯克豪言,xAI 的使命是为了解宇宙本质:将专注于开发真实的、代表全人类最大利益的 AI 系统;Grok 将具备 “严谨、真理与趣味性”,而不是像 OpenAI 那样只顾着 “政治正确”。但在创业路上,马斯克能屡屡涉险而过,就因为他从不是个会单纯 “为爱发电” 的梦想家,而是有深谙营销的精明。最近,马斯克便表示:xAI 将通过包括特斯拉在内的公司销售 Grok,而自动驾驶将成为 Grok 最重要的应用场景。
一切回到在商言商时,味道变得熟悉起来。
但不看好马斯克做 AI 的也大有人在。5 月 28 日,马斯克在 “X” 上为 xAI 高调招兵买马时,遭到了 “AI 教父”、现任 Meta 首席 AI 科学家 Yann LeCun(杨立昆)毫不客气的回怼:“如果你能忍受这样的老板,请加入 xAI:声称你正在做的事情明年就能解决;声称你研究的东西会杀死所有人;声称要‘最大限度地追求真相’,却在自己的社交平台上散布疯狂的阴谋论。”
而面对马斯克的攻势,OpenAI 也迅速拉起防御。5 月 29 日,OpenAI 在官网宣布:已开始训练下一代前沿模型,他们会在通往 AGI 之路上达到更高的能力水平。5 月 30 日,OpenAI 又宣布,所有 ChatGPT 免费用户现在都可以使用浏览、视觉、数据分析、文件上传和 GPTs 等原付费功能。这也意味着,对付费用户,ChatGPT 仍有后手大招。
▲(图源 / 网络)
靠资金上桌,靠算力点菜
成立于 2015 年的 OpenAI,经过多代模型的迭代,才借助 ChatGPT 走入了大众视野,融到 140 亿美元。而马斯克的 xAI 能一夜之间拿到了 OpenAI 接近一半的融资,是哪家金主,支撑起了马斯克的宏愿?
据外媒报道,60 亿美元的出资者,既包括马斯克的多年盟友,特斯拉和 SpaceX 的首批投资者 Valor Equity Partners,也有实力雄厚的迪拜投资公司 Vy Capital—— 耐人寻味的是,OpenAI 的投资方红杉资本、a16z 也赫然在列。
这也不难理解。一方面,近日硅谷各方巨头都在投入巨资训练下一代模型,AI 的商业化落地也一触即发;另一方面,OpenAI 团队 “宫斗” 频繁,有理由相信,资本方也并不愿看到 OpenAI 一家独大。
除了到手的 60 亿美元,马斯克的底气还来自与英伟达的良好关系 —— 在 5 月英伟达一季报业绩会上,谈及下一代旗舰芯片 Blackwell 的客户名单时,除了 OpenAI、亚马逊、谷歌等大客户,英伟达还特别提到了马斯克的 xAI。
▲(2015 年,马斯克与黄仁勋在 GPU 技术会议上)
据 The Information 报道:马斯克对 xAI 的投资者表示,融来的大部分资金,将用于租用 AI 芯片。他向投资者暗示:自己是全球少数几位能筹集足够资金、搞到芯片、与顶尖 AI 公司竞争的人选之一。
马斯克表示,承载起 xAI 算力的 “超级工厂” 会由他亲自负责,它由 10 万颗英伟达 H100 芯片组成,将于 2025 年秋季建成。而目前已知的最大规模 GPU 集群属于 Meta,该集群由 2.4 万颗 H100 GPU 组成 ——Meta 在训练 Llama 3 时,使用了两个这样的集群。
不过,即便是强势如马斯克,如今要想从强劲对手的环伺中 “抢到” 足够算力,压力依然不小。
据 “北拓资本” 测算,英伟达 2024 年 H 系列 GPU 的出货量,大约在 223266 万片,B 系列 GPU 出货量约在 2129 万片。近期,微软追加下单了 12 万台服务器,其中包括 96 万片 H100、32 万片 B200;Meta 下单了 35 万片 H100、6.96 万片 B200。
上述两家,已经占去了英伟达大半的供应量 —— 这还未将谷歌、亚马逊、甲骨文等厂商的订单量计算进去。
▲(2023 年英伟达 H100 出货量测算,图源 / Omdia)
国内一家知名算力供应商负责人对「市界」坦言:“市场到底需要多少算力?这是一个很难预计的数字。目前 OpenAI 在使用至少 6 万卡以上的集群,这个数字还会持续增加。不排除有的企业最终会找到模型压缩的方式,可以小集群干大事。” 但在此之前,算力的争夺和内卷,仍是大模型发展的前提。
某种程度上,马斯克只能为 xAI 快速充值,却不能帮它长出肌肉 —— 算力正在限制着 Grok 的成长速度。
目前 Grok1.5 能够实现 128K tokens 的长文本理解和高级推理能力。业界认为,要想短时间内达成如 ChatGPT 般丝滑的对话效果,在 10 万块 GPU 集群上加速训练是必须的。
因此,近日马斯克也亲口承认:Grok 与 OpenAI 和谷歌的竞争,还有很长的路要走。目前,xAI 已是甲骨文最大的 H100 芯片租赁客户,使用了后者 1.5 万块 H100 芯片。未来,xAI 或将继续与甲骨文合作,建造超级计算机。
与 OpenAI 的十年骂战
在拿到 60 亿融资以前,马斯克还没忘记抓住一切机会,拉踩老对手。5 月 23 日,马斯克在巴黎举行的 “VivaTech 技术大会” 上,再度将矛头指向 OpenAI 和谷歌,批评他们为了 “政治正确”,在生成内容的准确度、真实性上大打折扣。
不过,考虑到马斯克与 OpenAI 已积累了长达 10 年的恩怨情仇,他的怒火恐怕不那么单纯。
今年 3 月 1 日,美国旧金山法院官网上更新了一份 46 页的起诉文件,显示马斯克将 OpenAI 及其现任 CEO 山姆・奥特曼等人告上了法庭。原因是马斯克认为 OpenAI 违反了创业时的约定,并列出了包括合同违约、承诺违约、违反信托责任、不公平商业行为、会计审计问题等多条罪状。
沉寂了 5 天后,OpenAI 选择反击,在自家官网上发布了名为《OpenAI 与埃隆・马斯克》的长文,一一驳斥了马斯克的指责,并从自己的角度梳理了双方的恩怨。
令人叹息的是,虽然马斯克现在与 OpenAI 已成死敌,但最初,他们对 AI 世界抱有同样的愿景。
2023 年出版的《埃隆・马斯克传》中,这样描述过 OpenAI 的创办背景:从 2012 年开始,马斯克逐渐意识到了 AI 发展的潜在危险,但在寻求合作的过程中数次碰壁。直到他向时任著名孵化器 YC 总裁山姆・奥特曼谈起想法,两人最终达成了共识。
2015 年,OpenAI 正式创立,马斯克与奥特曼均担任联席董事长职位。此后,马斯克陆续向 OpenAI 注资了接近 4500 万美元,并运用自己的声望和人脉,为 OpenAI 招揽了大量人才。
但随着马斯克陆续启动了 Neuralink、特斯拉自动驾驶等 AI 项目,双方的共识开始被打破。到 2017 年底,马斯克产生了将 OpenAI 与特斯拉整合的想法,并开始谋求对 OpenAI 的控制权。
这自然遭到了奥特曼和管理层的反对。在 2018 年 2 月的一次员工会议上,马斯克宣布辞去在 OpenAI 的职务,对外则声称特斯拉与 OpenAI 之间存在利益冲突。同时,马斯克带走了 OpenAI 的核心人才 Andrej Karpathy,任命其为特斯拉自动驾驶首席架构师。
因此,市场一直有猜测,马斯克成立 OpenAI 的初衷,除了发展开源 AI,或许也是为了给特斯拉积累技术,并储备 AI 行业顶尖人才。
有趣的是,正因为马斯克的离去,OpenAI 不得已转投微软,并重新制定了生成式 AI 的发展方向,才得以因祸得福,一飞冲天。而在分道扬镳之后,马斯克显然没有放弃对 AI 的兴趣,最终入局,成为了 OpenAI 的对手。
种种恩怨背后,马斯克与 OpenAI 双方,也衍生出了一场旷日持久的骂战。马斯克、奥特曼、xAI、ChatGPT 等认证账号,常常在社交媒体平台上你来我往、唇枪舌剑。
在 xAI 融资 60 亿消息披露之后,马斯克的招聘推文下,Meta 首席 AI 科学家杨立昆也下场拆台评论,两人的互喷在 X 上引来了 3000 万人的围观。
▲(图源 / 网络)
今年 3 月,马斯克与 OpenAI 对簿公堂时,便有 AI 从业者对「市界」指出,不论是骂战还是起诉,马斯克对 OpenAI 的穷追不舍,都有营销和市场需求。“我和身边的朋友交流,一致认为马斯克的起诉论据并不充分。这个时间点很特殊,正好是在 Grok-1.5 马上要发布之前。”
60 亿美元多少是为了特斯拉?
从短期来看,马斯克融到的 60 亿美元,虽然让 xAI 上了第一梯队的牌桌;但考虑到马斯克在 AI 行业内的人望,以及 AI 创业之激烈,他的这次入局,也远远谈不上众望所归。而 xAI 被拉起的高昂估值,未来也可能会成为一场 “纸面富贵”。
据 The Information 报道,微软和 OpenAI 已经准备好,到 2028 年时要投入超 1000 亿美元打造一个数据中心项目,其中包括一台名为 “星际之门(Stargate)” 的 AI 超级计算机,配备了数百万个专用服务器芯片,为 OpenAI 实现 AGI 提供动力。
这一远景如果成真,AI 的创业竞赛,或许会成为只有巨头玩得起的算力军备游戏。而马斯克此刻砸下的 60 亿美元,也代表了他对于 “掉队” 的担忧。
从去年 11 月,xAI 推出了首个聊天机器人 Grok-1 之后,它就一直在巨头后面苦苦追赶。半年多来,xAI 陆续发布了 Grok1、具备长文本理解能力的 Grok-1.5、首款多模态大模型 Grok-1.5V,迭代速度已不算慢。
但与 ChatGPT 每次的惊艳亮相相比,Grok 还有不小距离。现在,Grok 被外界认同的最大亮点是,训练数据主要来自于马斯克 2022 年收购的社交媒体平台 “X”,因此,Grok 也被称为 “叛逆” 版的 ChatGPT,生成式回答更具幽默感。
另一方面,马斯克对大模型的执着,很大程度上离不开与特斯拉的协同考虑。
2022 年底,特斯拉自动驾驶部门的工程师曾向马斯克提出建议,可以借鉴 ChatGPT,让神经网络通过学习人类驾驶员的训练素材,来实现路径规划。
2023 年 11 月,Grok-1 刚刚发布时,马斯克便开始畅想将它接入特斯拉汽车的未来。
他发帖称:“如果我们的车载 AI 计算机能够运行 Grok,特斯拉将可能拥有地球上最多的、真正可用的推理计算机。即便是在出租车上,汽车每周也只需要用 1/3 的时间规划行驶任务,剩下 2/3 的时间可用于分布式推理计算。比如 SETI(搜寻地外文明计划)。”
毕竟训练特斯拉的自动驾驶,同样需要数据与算力。此前,特斯拉就被曝出到 2024 年底,投入远超 10 亿美元打造一台「Dojo 项目」的内部超级计算机,用于处理数据和视频。在马斯克眼中,大模型与自动驾驶不如双脚并行。
在 Grok 的使用场景上,马斯克也将其和 X 平台嫁接起来,并开始构想它的商业化未来。
2023 年 12 月,结束了早期 beta 测试的 Grok,开始为每月付费 16 美元的 “Premium +” 会员提供服务。作为对比,ChatGPT Plus 的订阅价格是每月 20 美元。
2024 年 3 月 18 日,3140 亿参数级大模型 Grok-1 正式对外开源开放。3 月底,马斯克表示 Grok 将向 X 平台上每月付费 8 美元的 “Premium” 会员全面开放;“Premium+ ” 用户则会获得 Super Grok 的疯狂娱乐模式。
另外,此刻马斯克高调下场,或许也有一点要给 OpenAI 落井下石的因素 —— 毕竟他们正陷入 “宫斗” 第二季的漩涡当中。
近期,OpenAI 超级对齐部门集体离职、不当股权协议等事件频出。5 月 16 日,OpenAI 超级对齐(Superalignment)团队负责人、OpenAI 联合创始人、首席科学家 Ilya Sutskever 宣布离职。紧随其后,该团队另一位负责人 Jan Leike、OpenAI 安全策略研究员 Gretchen Krueger 也被曝将离职。
2023 年 7 月才成立的 “超级对齐” 团队,至今还不满一年。该团队旨在确保 AI 发展符合人类利益,计划未来 4 年投入 20% 算力,用 “AI 监督 AI” 的方式,保证 AI 的目标与人类价值观和利益一致。
如今主要成员纷纷离职,据外媒报道,是 OpenAI 不愿给予团队足够的算力支持。
几乎同一时期,OpenAI 被曝要求离职员工签署保密协议,承诺绝不发声批评公司,否则就无法获得薪资包中的股权部分。曝光文件显示,该协议正是由山姆・奥特曼亲自签署。
凡此种种,OpenAI 曾经高喊的 “OpenAI is nothing without its people”(没有员工,OpenAI 便一无是处)的价值观开始出现裂缝;不少员工对其奔赴 AGI 的信念,或许业已崩盘。相比全力奔赴目标的 xAI,用内忧外患来形容 OpenAI,并不为过。
而从马斯克可以轻易获得 60 亿美元融资来看,资本市场也正在寻求 OpenAI 之外的新的 plan B。