4月2日,英伟达CEO黄仁勋在Cadence Live 2026大会上表示,英伟达不仅制造高价的AI硬件,还计划成为全球最低成本AI Token的领导者。他明确指出:“我们生产的是全球成本最低的Token。”
Token是AI模型处理语言的基本单元,其生成速度与成本直接取决于硬件和软件的协同效率。黄仁勋指出,单靠硬件的强大计算能力虽然能够产生大量Token,但并不是高效的解决方案。
真正的关键在于硬件的深度适配,而这正是英伟达CUDA生态的优势。经过多年的工程迭代,CUDA软件栈已将英伟达的硬件打磨成业界公认的最佳Token生成方案。
尽管英伟达的AI系统售价高达数百万美元,例如Blackwell或即将推出的Rubin平台,单套设备能带来数十亿美元的收入。
然而,黄仁勋强调,这些系统的Token生产成本和每瓦Token产出率均为全球最低。他的逻辑十分简单:买得越多,省得越多。随着设备吞吐量达到前所未有的规模,摊薄到每个Token上的成本反而最低。
英伟达因此推出了一套全新的AI总运营成本(TCO)衡量标准,核心指标不再是系统的峰值吞吐量,而是单个Token所需的成本和功耗。
黄仁勋判断,AI行业的未来必然是全栈式竞争。公司必须同时掌握顶层软件栈、中间系统和上层应用。下一个前沿赛道将是智能体AI(Agentic AI),该技术已迅速席卷行业。
不过,英伟达也面临现实压力。各家厂商正在密集推出对标Rubin平台的竞品,同时供应链限制日益严峻。但从长远来看,黄仁勋自布局AI战略以来,英伟达已连续多年保持成功,这一势头目前未见逆转。