瑞技科技

重磅消息

EN
 
算力狂人马斯克的“暴力美学”:214天狂砸20万块 GPU,掀起 AI 基建革命
首页 > 网站博客 > 算力狂人马斯克的“暴力美学”:214天狂砸20万块 GPU,掀起 AI 基建革命

算力狂人马斯克的“暴力美学”:214天狂砸20万块 GPU,掀起 AI 基建革命

当其他公司还在纠结模型参数时,埃隆·马斯克(Elon Musk)选择用物理的绝对规模碾压对手——在短短214天内,xAI 建成了拥有了20万块 GPU 的 Colossus 智算集群,这不仅是算力的象征,更是基建速度的宣言。

算力狂人马斯克 20万 GPU,改写 AI 基建规则

马斯克的 AI 野心正以超乎想象的速度落地。美东时间2025年2月17日,xAI 宣布 Grok-3 完成训练,其背后的算力巨兽 Colossus 集群再次刷新行业认知: 

 

  • 首期部署:10万块 NVIDIA H100 GPU 上线,仅用122天。 

  • 二期扩容:新增10万块 GPU(其中5万块为 H200),仅耗时92天。

  • 总建设周期:214天。

 

*冷知识:Colossus 的建设速度比特斯拉造新车还快(特斯拉开发新车通常需要18-24个月)。

Colossus 20万块 GPU 的智算集群
Colossus 20万块 GPU 的智算集群

Colossus 的20万块 GPU 的智算集群让算力密度提升了10倍, 成为史上首个「推理分破1400」的 AI 巨兽。Grok-3在数学、编程等基准测试中碾压 GPT-4o、Gemini 等众多对手。

连黄仁勋都惊叹:马斯克19天干完别人4年的活

英伟达 CEO 黄仁勋(Jensen Huang)曾在访谈中直言:“马斯克简直是超人,别人花4年的事他19天搞定。” 他指出,通常情况下,重大智算集群项目从概念的萌生,到最终上线运营,可能需要历经 4 年的漫长筹备(3 年精心规划,1 年设备运输、安装以及调试),然而马斯克却凭借非凡的执行力,仅用 19 天就完成了 Colossus 首期 10 万块英伟达 GPU 的部署上线,令人叹为观止。

200,000块 GPU 如何搬运?硬核神器亮了!

当我们将目光聚焦在 200,000 块 GPU 这一庞大数量上时,一个现实难题摆在眼前:如此巨量的设备,究竟是如何搬运就位的呢?答案便是一款硬核 IT 设备搬运神器 ——ServerLIFT 升降机。在马斯克众多堪称逆天的项目中,如位于得州超级工厂的 Cortex AI 数据中心和 Colossus 超算集群,ServerLIFT 都扮演着设备搬运、上架的关键工具。

源自马斯克 X:展示 Cortex 内部情况,员工正在使用 ServerLIFT 部署上架

Cortex:马斯克位于得州的超级工厂,专攻自动驾驶 AI 训练,初期算力达130兆瓦,计划扩展至500兆瓦,搭载超10万颗英伟达 H100/H200 GPU 及自研 Dojo 芯片,硬件总重堪比“移动的摩天大楼”。

源自 The Tesla Space YouTube 账号:展示 Colossus 内部情况,员工正在使用 ServerLIFT 部署上架
源自 The Tesla Space YouTube 账号:展示 Colossus 内部情况,员工正在使用 ServerLIFT 部署上架

Colossus:全球最大 AI 超算集群之一,拥有20万块 GPU,单机架容纳64个液冷H100 GPU,总机架数超1,500个。

AI 时代的“部署哲学”——为何选择 ServerLIFT?

马斯克的选择 ServerLIFT 升降机的背后,是 AI 基建的三大铁律: 

 

  • 规模决定重量:以 Colossus 为例,10万块 GPU 意味着数万台服务器的物理部署,总重量过万吨。若采用人力搬运,仅工伤风险效率低下便足以拖垮项目进度。 

  • 精度决定成败:高价值的英伟达 GPU,以及众多 AI 设备稍有磕碰可能就会损坏。ServerLIFT 的“SmartTILT™”定位能力,可以精确调整平台角度,避免磕碰,确保安装精准度。

  • 时间决定生死:当下 AI 竞赛已步入 “秒级迭代” 的白热化阶段,Cortex 就曾因冷却系统延误而被迫推迟上线,而 ServerLIFT 安全、高效的装卸能力,为马斯克成功抢回了宝贵的部署时间窗口。

ServerLIFT 升降机:AI 智算中心的终极之选

ServerLIFT 升降机提供了一套高效、安全的 AI 智算中心服务器部署解决方案

瑞技独家总代的 ServerLIFT 升降机提供了一套高效、安全的 AI 智算中心服务器部署解决方案,专为现代数据中心/智算中心而设计,功能强大,能够有效提升智算中心的工作效率和安全性。

ServerLIFT 为何与众不同?

适用于任何现代数据中心,任何 IT 设备, 任何运维人员的智能升降机

ServerLIFT 智能升降机的设计全面考虑了智算中心的多样化需求和运维人员的操作便利性。能够轻松处理从小型服务器到大型 GPU 集群的各种 IT 设备,确保在任何智算中心环境中都能高效、安全地完成设备上下架及搬运任务。

ServerLIFT是NVIDIA 官方推荐的 DGX H100 服务器升降设备 

NVIDIA 官方推荐的 DGX H100 服务器升降设备

在英伟达 DGX SuperPOD 数据中心设计参考指南中,ServerLIFT 升降机是 NVIDIA 唯一官方推荐的 DGX H100 服务器升降设备。充分证明了 ServerLIFT 在高性能计算设备搬运中的卓越可靠性和高效性。

符合全球认证的安全标准

ServerLIFT 是 ISO:9001 和 ISO:14001 认证制造商,其生产的数据中心升降机是全球唯一获得 CE、FCC/IC和 UL 等认证的数据中心服务器升降机。

ServerLIFT 符合全球认证的安全标准

显著提升效率

在保障设备和人员安全的同时,ServerLIFT 解决方案大幅提高了运维效率,根据使用人数,ServerLIFT 可将智算中心效率提高多达300%。其高效的设备搬运能力使得智算中心能够快速增加或更换硬件设备,更快地响应业务需求和技术更新。

ServerLIFT 可将智算中心效率提高多达300%

100%无事故记录

自推出以来,ServerLIFT 在客户报告中保持了100%无事故记录,充分展示了其在高强度使用环境中的安全性和可靠性。通过减少人为错误和安全事故,智算中心可以保持稳定和高效运营。

广泛的客户信赖

ServerLIFT 获得了全球超过40%的百强公司的信赖,广泛应用于其数据中心的日常运营和维护工作。

ServerLIFT 中国独家授权总代 - 瑞技全力支持您的成功

瑞技深知每个数据中心的独特需求和挑战。作为 ServerLIFT 在中国的独家总代理,瑞技为客户提供量身定制的解决方案,确保硬件部署的高效性和安全性。同时,瑞技能为客户在全球物流与配送、库存管理、供应链管理、IT 实施与项目管理及持续支持方面提供全面支持,确保您在 AI 时代获得最佳的解决方案和服务。

举重若轻——托起 AI 的未来

从 Cortex 的自动驾驶梦想,到 Colossus 的通用 AI 宏大野心,马斯克用超二十万块 GPU 建立起的 AI 帝国,深刻揭示了一个不容忽视的行业真相:AI 之争,从来不止是代码与算法的较量,更是现实世界中一场关乎 “重量与时间” 的极限博弈。而在这场硬件与算法交织的竞技场上,ServerLIFT 凭借其卓越实力证明 —— 即便再庞大的算力,也需要一双能够“举重若轻”的巧手来精心托举,方能稳步向前。

行业前瞻

最后,有一个颇有意思的点,一度狂跌的英伟达股价,如今已悄然回升至 DeepSeek – R1 发布前的水平——市场正在用真金白银为 Scaling Laws 投票。

部分业内人士认为,Grok -3 的惊艳亮相,再次印证了在大规模算力和数据的强力支撑下,Scaling Laws 在当下依旧具备重要的参考价值。对于 AI 未来的发展走向而言,这一成果无疑为业界提供了全新的观察视角。无论是大模型的规模化发展路径,还是计算资源的整合优化能力,都将成为推动技术持续迭代与创新的关键驱动因素。