平台比产品更有价值
GPU 不是单一产品,而是一个可编程平台。CUDA 的价值不在于 API,而在于让全球研究者用同一套工具积累了十年的算法和论文。
来源:Jensen Huang GTC Keynote 2023, NVIDIA official / Acquired Podcast with Jensen Huang, 2023
Loading Thinker Node
正在读取方法论、关键决策和影响关系。
把 GPU 变成 AI 时代基础设施的工程师型 CEO
黄仁勋是 NVIDIA 联合创始人兼 CEO,自 1993 年公司成立至今从未离开过 CEO 职位。他带领 NVIDIA 从游戏 GPU 供应商转型为 AI 时代最关键的算力基础设施提供商。2006 年推出 CUDA 并行计算平台是其最重要的战略押注:在深度学习成为主流前整整六年,CUDA 为科研社区提供了 GPU 通用计算能力,积累了无可替代的生态护城河。2012 年 AlexNet 验证深度学习后,NVIDIA 的先发优势迅速兑现。2022 年 ChatGPT 引爆 AI 需求,NVIDIA 市值在两年内突破 3 万亿美元。黄仁勋以其强烈的工程直觉、对技术路线图的长期承诺以及对垂直整合的偏好著称,同时也因对员工的高强度要求和公司估值的泡沫质疑而受到争议。
GPU 不是单一产品,而是一个可编程平台。CUDA 的价值不在于 API,而在于让全球研究者用同一套工具积累了十年的算法和论文。
来源:Jensen Huang GTC Keynote 2023, NVIDIA official / Acquired Podcast with Jensen Huang, 2023
竞争优势不来自单一产品迭代,而来自持续多年对某个技术方向的孤注一掷式投入,让竞争对手无法快速追赶。
来源:Lex Fridman Podcast #309 with Jensen Huang, 2023
真正的性能优势来自硬件与软件的协同设计,而不是单独优化任何一层。CUDA、cuDNN、TensorRT 与硬件深度绑定体现了这一信念。
来源:Hot Chips 2022, NVIDIA Hopper Architecture deep-dive
当市场或产品方向不对时,迅速有序地放弃,把资源集中到下一个更大的胜负手,而不是在错误方向消耗资源。
来源:Acquired Podcast with Jensen Huang, 2023
每个产品决策都要问:这是否在加固我们的平台护城河?
CUDA 在 2006 年推出时并不盈利,但黄仁勋坚持投入,因为他预见到可编程 GPU 将成为科学计算的通用平台,而非仅服务游戏市场。
只有 10 倍以上的性能提升才能改变用户行为,5% 的改善无法改变生态格局。
H100 对比 A100 的 AI 训练性能提升幅度设定了"值得切换"的门槛,推动数据中心大规模升级换代。
为尚不存在的市场投资,提前十年布局;当市场爆发时,竞争者已无法追赶。
NVIDIA 在深度学习被广泛接受前六年就持续投资 CUDA 和 GPU 计算研究合作项目,2012 年 AlexNet 一出现就具备压倒性优势。
不仅卖硬件,而是让开发者的代码、模型、工具链都依赖你的平台。
cuDNN、TensorRT、NCCL 等免费开源工具库将研究者的工作流深度绑定到 NVIDIA GPU,使得切换到 AMD 或其他平台需要巨大迁移成本。
CUDA 以开放研究社区的姿态出现,但本质上是将全球 AI 开发者锁定在 NVIDIA 专有生态中,任何离开 CUDA 的迁移都需要数年重写工作量。
黄仁勋以皮衣和煮饺子的平易形象示人,但在商业上对英特尔、AMD 和各类 AI 芯片初创公司发起连续性竞争压制。
1993-1998
从零创办 NVIDIA,押注 3D 图形芯片,定义 GPU 概念
1993 年黄仁勋与 Chris Malachowsky、Curtis Priem 联合创办 NVIDIA。早期主打固定功能图形处理,1997 年 RIVA 128 打开市场,奠定游戏 GPU 基础。
1999-2005
推出 GeForce,创造"GPU"术语,奠定游戏市场主导地位
GeForce 256 在 1999 年发布时首次将变换和光照计算移到显卡内,黄仁勋创造了"GPU"一词并推动 NVIDIA 上市。但 2002 年内部危机几乎葬送公司,逼出了后来的文化重建。
2006-2011
推出 CUDA,开创 GPU 通用计算,积累 AI 前的生态基础
2006 年 CUDA 的推出是 NVIDIA 史上最重要的战略决策,将 GPU 从图形专用芯片变为可编程计算平台,吸引物理仿真、分子动力学、金融模型等领域研究者加入生态。
2012-2021
AlexNet 验证后全面转向深度学习,定义 AI 算力标准
2012 年 AlexNet 用 NVIDIA GPU 赢得 ImageNet 后,深度学习研究爆炸式增长。NVIDIA 快速推出 cuDNN、P100、V100、A100 等产品,将 AI 算力标准定义权掌握在自己手中,并向 DGX 超级计算机系统扩展。
2022-至今
ChatGPT 引爆需求,Hopper/Blackwell 架构主导全球 AI 基础设施
H100 成为 AI 时代最稀缺的生产资料,NVIDIA 市值从 3000 亿美元攀升至 3 万亿美元以上。黄仁勋在全球 AI 投资热潮中确立了 NVIDIA 作为 AI 时代 picks and shovels 供应商的不可替代地位。
背景:1993 年,黄仁勋时年 30 岁,与同在 Sun 和英特尔工作的 Chris Malachowsky、Curtis Priem 在加州 Denny's 餐厅讨论创业机会。PC 游戏市场正在形成,3D 图形将是下一个突破口。
决策:放弃稳定的 LSI Logic 工程师职位,三人联合创办专注 3D 图形处理器的 NVIDIA Corporation。
决策推理:PC 游戏对 3D 图形的需求将快速增长,市场空白巨大,而当时图形处理能力严重受限于 CPU;专用图形芯片将获得指数级性能优势。
结果:NVIDIA 获得 Sega 等早期客户支持,1997 年 RIVA 128 取得市场成功,公司在 1999 年成功上市。
洞见:在技术市场爆发前提前进入、专注单一技术突破,是半导体创业成功的前提条件。
背景:NVIDIA 在游戏显卡市场逐步站稳脚跟,但仍与 3dfx、ATI 竞争激烈。图形处理的变换和光照计算仍在 CPU 侧运行,限制了整体性能上限。
决策:推出 GeForce 256,将变换与光照(T&L)计算移入芯片内部,并正式命名这类处理器为 GPU(图形处理器)。
决策推理:将 T&L 移入专用硬件可释放 CPU 算力,大幅提升游戏帧率;命名 GPU 是品类定义动作,确立 NVIDIA 作为该品类创建者的叙事优势。
结果:GeForce 256 成为市场主导产品,NVIDIA 于 1999 年在纳斯达克成功上市,市值约 6 亿美元。
洞见:命名一个品类并成为其定义者,是建立长期市场叙事优势的战略工具,不仅仅是营销行为。
背景:2001 年 NVIDIA 获得 Xbox 合同后快速扩张,但 2002 年互联网泡沫破裂、消费级电脑需求萎缩,库存积压严重。同期 GPU 驱动 bug 危机损害了品牌声誉,内部文化出现动荡。
决策:大幅裁员约 20% 员工,重组组织结构,推行激进的文化变革;将技术文档和决策透明化,建立对抗性审查制度。
决策推理:危机暴露了快速扩张时形成的执行脆弱性,必须通过文化重塑建立长期执行纪律,而不仅仅是缩减规模。
结果:NVIDIA 在 2003-2004 年重新聚焦核心,为 GeForce FX 之后的 G70 架构奠定了更扎实的工程基础;公司文化中形成了坦诚评审和技术精确性的传统。
洞见:业务危机是文化建设的窗口期;压力下建立的执行纪律往往比顺境期更持久。
背景:科学计算社区已经尝试在 GPU 上运行通用计算任务,但需要通过 OpenGL 图形 API 进行复杂的间接操作。NVIDIA 的 G80 架构是首款统一着色器架构,具备支持通用编程的硬件基础。
决策:随 GeForce 8800 同步推出 CUDA C/C++ 编程环境,允许开发者直接用 C 语言编程访问 GPU 算力,免费向研究社区开放。
决策推理:科学计算市场规模不及游戏市场,但可编程 GPU 平台的生态价值将远超单一产品销售;吸引研究者用 CUDA 产出论文和工具,形成不可替代的软件生态护城河。
结果:早期吸引物理仿真、医学影像、分子动力学等领域研究者;至 2012 年,机器学习研究者开始大量采用 CUDA,成为深度学习革命的底层使能技术。
洞见:为尚未爆发的未来市场建设平台生态,接受短期亏损换取长期护城河;开放免费是做平台的基本动作。
背景:2012 年 ImageNet 挑战赛,Geoffrey Hinton 团队的 AlexNet 用两块 NVIDIA GTX 580 训练,以压倒性优势夺冠,错误率比第二名低了近 11 个百分点。这是 GPU 深度学习的第一次公开验证。
决策:黄仁勋立即将 NVIDIA 研发重心大幅转向 AI 训练加速,将 Tesla 数据中心 GPU 和 cuDNN 库的资源投入大幅增加,并开始与 Google、OpenAI 等研究机构建立深度合作。
决策推理:AlexNet 证明了六年前在 CUDA 上的押注是正确的;深度学习将成为下一个计算范式,数据中心 GPU 将取代游戏 GPU 成为公司核心增长引擎。
结果:2014 年推出 cuDNN,大幅降低了深度学习框架在 NVIDIA GPU 上的开发门槛。P100(2016)、V100(2017)、A100(2020)、H100(2022)形成了数据中心 AI 算力的技术路线主轴。
洞见:当技术押注被验证的信号出现时,要果断加倍投入,而不是犹豫观望;先发优势窗口转瞬即逝。
背景:NVIDIA 刚推出 DGX-1——第一款专为深度学习设计的 AI 超级计算机,集成 8 块 Tesla P100。OpenAI 是一家成立不足一年的 AI 研究机构,黄仁勋认为 AI 研究社区的成功是 NVIDIA 未来算力市场的必要前提。
决策:黄仁勋亲自出席,将第一台 DGX-1(价值约 12.9 万美元)作为捐赠交付给 OpenAI,并在 Twitter 上称其为世界上第一台 AI 超级计算机。
决策推理:通过与最具影响力的 AI 研究机构建立早期深度绑定,确保 NVIDIA 成为 AI 研究基础设施的标配;捐赠成本远低于获取战略合作伙伴的常规商业成本。
结果:OpenAI 此后所有核心模型(GPT 系列)均在 NVIDIA GPU 上训练,并最终带动了 2022-2024 年全球对 H100 的疯狂需求;这次捐赠被视为 NVIDIA 历史上回报率最高的投资之一。
洞见:在生态的关键节点投入资源(哪怕以捐赠形式),其战略价值远超直接商业收益的计算逻辑。
背景:ARM 是全球移动和边缘计算芯片架构的标准,几乎所有移动 SoC 均使用 ARM 指令集授权。软银在 2016 年以 310 亿美元收购 ARM 后,正在寻求退出路径。
决策:宣布以约 400 亿美元(股票+现金)收购 ARM,黄仁勋公开承诺保持 ARM 作为中立授权机构的地位,将 NVIDIA 的 AI 技术整合进 ARM 生态。
决策推理:控制 ARM 架构将使 NVIDIA 从 AI 训练算力拓展至边缘推理和移动计算,形成从云到端的完整 AI 算力版图;同时阻断英特尔和 AMD 等潜在竞争者控制这一关键架构的可能性。
结果:2022 年 2 月,受美国 FTC、英国 CMA 和欧盟反垄断监管机构集体阻止,收购宣告终止。ARM 于 2023 年独立 IPO。
洞见:当一项战略资产关乎整个行业的基础架构时,垄断性收购几乎必然遭遇监管阻拦;行业基础设施的控制权争夺需要更迂回的路径。
背景:2022 年 3 月 GTC 大会前,AI 训练需求主要来自少数科技巨头。ChatGPT 于 2022 年 11 月发布后,全球企业和政府同时意识到大模型的商业价值,对 H100 的需求爆发式增长。
决策:发布基于 Hopper 架构的 H100,专为大型 Transformer 模型优化,引入 Transformer Engine 动态精度管理,并以 DGX H100 超级计算机系统形态销售给超大规模数据中心。
决策推理:大语言模型的 Transformer 架构对矩阵乘法的需求与 GPU SIMD 架构高度契合;专门针对 Transformer 优化的硬件将获得代际性能领先,且 CUDA 生态已无法被短期复制。
结果:H100 成为 2023-2024 年最稀缺的计算资源,等待周期长达 6-12 个月;NVIDIA 数据中心营收从 2022 年的约 150 亿美元增至 2024 年超过 900 亿美元;公司市值突破 3 万亿美元。
洞见:二十年的生态积累使 NVIDIA 成为唯一能在需求爆发时立即响应的供应商;护城河的价值在需求暴涨的那一刻才得到最充分的检验。
背景:H100 供不应求,各大云厂商和 AI 公司都在寻求下一代算力。AMD MI300 和 Google TPU 等竞争者开始对 NVIDIA 的垄断地位构成挑战;英伟达需要用技术路线图的持续领先来防御。
决策:在 GTC 2024 发布基于 Blackwell 架构的 B100/B200,宣称 AI 训练性能比 H100 提升 4 倍,推理性能提升 30 倍;同步推出 NVLink 域 GB200 NVL72 大规模集群方案。
决策推理:推理市场将远大于训练市场,Transformer 的 KV-cache 内存需求将推动对内存带宽的极端需求;集群级优化比单卡优化更能建立差距。
结果:Blackwell 成为 2025 年最受追捧的算力产品,NVIDIA 维持了 AI 算力市场超过 80% 的份额;但量产初期出现过热问题,导致交付延迟约一个季度。
洞见:护持技术领先地位需要永无止境地发布下一代路线图,让竞争者永远在追赶上一代而不是挑战当代。
英特尔前 CEO Andy Grove 的《只有偏执狂才能生存》和英特尔工程执行文化对黄仁勋的管理哲学有深远影响,尤其是战略转折点思维框架。
摩尔定律的性能翻倍范式影响了黄仁勋对半导体路线图的规划逻辑,他认为 GPU 的性能提升轨迹将超越摩尔定律。
斯坦福大学计算机体系结构奠基人,其关于并行计算和 RISC 架构的思想影响了早期 GPU 通用计算方向的技术判断。
OpenAI 的所有核心模型训练均依赖 NVIDIA GPU 和 CUDA 生态,黄仁勋对 AI 算力基础设施的定义直接塑造了 OpenAI 的技术路线选择空间。
CUDA 平台使深度学习算法的研究速度加快了一个量级,GPU 的可用性直接影响了 Transformer、RLHF 等关键算法的可行性验证时间。
AMD CEO 苏姿丰与黄仁勋是半导体行业最重要的竞争对手组合。苏姿丰带领 AMD 用 MI300 系列对 NVIDIA 的数据中心主导地位发起挑战,迫使 NVIDIA 加快创新节奏。
NVIDIA 首席科学家,斯坦福计算机科学教授,在 GPU 互联(NVLink)和并行计算架构上是黄仁勋最重要的技术合作者,推动了 GPU 集群级系统架构的演化。
Jensen is one of the best CEOs in the world. He has the ability to see around corners — he saw AI coming much earlier than anyone else and built the infrastructure for it.
NVIDIA has been unbelievably important to AI. Jensen Huang took a huge bet on building out CUDA and the GPU ecosystem, and that bet paid off in ways that no one could have fully anticipated.