人工智能加速器市场已经很拥挤,留给新进入者的空间很小。目前,美国有十几家公司专门为“人工智能”工作负载设计芯片。中国还有几十家这样的公司,当然,所有超大规模企业也都有这种芯片的某个版本。
当我们这样规划时,问题就变得清晰起来:市场上有很多这样的芯片,要么已经上市,要么即将上市。但有人会买吗?我们最好的猜测是,许多这样的初创公司的结果不会很好。我们这样说有几个原因。
第一个浪潮是历史性的。这不是第一波人工智能芯片初创企业浪潮,而是第三波。第一波浪潮出现在 2017 年左右,当时谷歌推出了 TPU。四年前又掀起一波浪潮,现在又掀起了第三波浪潮,由 ChatGPT 推动。第一波浪潮中的公司几乎如今都已不复存在,它们要么被收购,要么倒闭,要么徘徊在边缘。第二波浪潮正在苦苦挣扎,但在ChatGPT 的炒作热潮中得到了最后一刻的提振。虽然第三波浪潮可以做得更好,但它仍然面临着前两波浪潮所面临的同样挑战。
第二个因素是技术因素。简单来说,软件发展速度太快。我们以前见过这种模式。一家公司公布了其新芯片的计划,从纸面上看,它提供了显著的性能优势。但当芯片流片并投入生产时,它所设计运行的软件已经发生了很大变化,以至于芯片不再具有性能优势。
第三个因素是商业因素。客户不愿意尝试新芯片。将代码移植到新设计上需要花费大量成本,而且没人愿意成为试验品。除此之外,能够在数据中心使用这些芯片的客户数量有限。别忘了,这些潜在客户都在开发自己的芯片。最后,每个人都在与 Nvidia 竞争,有时 Nvidia 似乎势不可挡。
简单来说,有很多公司追逐一个小的可服务市场。
需要说明的是,我们讨厌写这篇文章。我们强烈主张增加美国半导体行业的风险投资。批评芯片初创公司让我们感到痛苦。请注意,我们在这篇文章中没有点名任何人。也许有一两家公司能够扩大规模,而且很可能会有更多公司被那些急需新方法进行 AI 设计的大公司收购。也许有人做对了——技术才华、创新商业模式和运气的某种结合——回报可能是巨大的,但除此之外,这个领域可能会非常具有挑战性。
写完以上内容后,我们意识到我们留下了一个问题:为什么这么多看似相似的公司追逐有限的市场?答案不会为我们赢得很多朋友。
问题的核心在于,美国风险投资生态系统已经失去了对半导体投资的肌肉记忆。我们之前已经写了很多关于这方面的文章。如果你预测未来 10 年科技行业的收入,超过 60% 将来自硬件,但在过去十年中,只有 10% 的风险投资资金流向了硬件。
在 ChatGPT 成立的几年前,我们带一家 AI 芯片公司去见了最著名的 Sand Hill Road 风险投资公司之一,这家公司为当今许多半导体巨头提供了资金支持。尽管介绍很热情,但他们还是花了一段时间才找到合适的人选。最后,我们与一位硅谷资深人士坐下来,他曾做过许多早期的半导体交易,他非常喜欢我们的推介。问题在于,此时,他已是名誉合伙人,他们让他重返工作岗位与我们会面,他不再具有影响力,无法带领合伙人参与这笔交易。
需要明确的是,我们对这种情况深表同情。首先,半导体的早期投资成本很高。三个人在车库里就能让一家软件公司获得数百万美元的收入。但一家芯片公司需要 5000 万美元才能推出第一款产品。而在过去 15 年左右的时间里,半导体风险投资的回报微不足道。
这些困难造成了一个负面反馈循环。支持投资一家芯片初创公司但最终以失败告终的初级合伙人会记住那段经历。当他们成为高级合伙人时,他们仍然带着那次糟糕退出的伤痛,并避开了整个行业。如果他们还有工作的话——2000 年代的一些交易结果确实很糟糕。无论如何,结果是大型风险投资基金逐渐抛弃了对该行业有所了解的合伙人。
风险投资家既聪明又灵活。他们一看到机会就立刻知道。因此,过去围绕人工智能芯片的浪潮,如谷歌的 TPU,清楚地标志着一个重要趋势,引起了投资者的极大兴趣。问题是,当 TPU 问世时,硅谷几乎没有人拥有足够的半导体知识来准确判断市场。
我们在 2010 年代参与了多个尽职调查项目,很明显投资者并没有很好地掌握一些芯片初创公司的前景。有时,似乎硅谷只有一家公司真正了解市场,而且他们几乎参与了每一笔交易。
结果,我们最终看到多个炒作周期推动投资。市场和 LP 再次看到了对芯片感兴趣的理由,投资者在没有充分了解风险的情况下蜂拥而至。这个过程现在已经重复了几次,但该行业出现的大量糟糕退出只会加强风险投资者对该行业的厌恶。
值得注意的是,今年许多规模巨大的 AI 加速器融资都是由非传统风险投资者牵头的。最知名的公司都在 TPU 时代的第一波浪潮中吃了败仗,而且大多没有参与最新的交易。红杉资本或许就是最好的例子,它发表了两篇警告不要炒作 AI 的文章。这些评论部分针对的是红杉资本自己的 LP,解释了该公司为何没有在这个领域进行大量投资。
最难的部分在于,一系列理性的决策导致了一个不理想的结果。虽然我们为半导体缺乏风险投资而感到遗憾,但我们也理解导致我们走到这一步的逻辑。我们并不是要批评老牌风险投资者——他们都有充分的理由采取行动。不幸的是,数十年过去的做法和机构记忆使得纠正这一航向非常困难。可能需要新一代风险投资公司才能让事情朝着更可持续的方向发展。
红杉:人工智能的 6000 亿美元问题
2023 年 9 月,我发表了《人工智能的 2000 亿美元问题》。这篇文章的目的是提出一个问题:“所有的收入在哪里?”
当时,我注意到 AI 基础设施建设所隐含的收入预期与 AI 生态系统的实际收入增长之间存在巨大差距,而 AI 生态系统的实际收入增长也是终端用户价值的代表。我将其描述为“按今天的水平,每年的资本支出都需要填补 1250 亿美元的缺口。”
今年六月,英伟达成功跻身全球最有价值公司行列。在此前后的几周里,我收到了无数请求,要求更新我的分析背后的数学依据。人工智能 2000 亿美元的问题解决了吗,还是更加严重了?
如果你今天再次运行此分析,你会得到以下结果:AI 的 2000 亿美元问题现在变成了 AI 的 6000 亿美元问题。
注意:直接计算这个指标很容易。你所要做的就是将 Nvidia 的运行率收入预测乘以 2 倍,以反映 AI 数据中心的总成本(GPU 占总拥有成本的一半,另一半包括能源、建筑物、备用发电机等)1。然后你再乘以 2 倍,以反映 GPU 最终用户的 50% 毛利率(例如,从 Azure 或 AWS 或 GCP 购买 AI 计算的初创公司或企业,他们也需要赚钱)。
自 2023 年 9 月以来发生了什么变化?
供应短缺已经消退:2023 年末是 GPU 供应短缺的高峰期。初创公司正在给风险投资公司打电话,给任何愿意与他们交谈的人打电话,寻求帮助以获得 GPU。如今,这种担忧几乎完全消除了。对于我交谈过的大多数人来说,现在以合理的交货时间获得 GPU 相对容易。
GPU 库存不断增长:Nvidia 在第四季度报告称,其数据中心收入的一半左右来自大型云提供商。仅微软一家就可能占Nvidia 第四季度收入的约 22%。超大规模资本支出正在达到历史水平。这些投资是大型科技公司 2024 年第一季度收益的主要主题,首席执行官们有效地告诉市场:“无论你喜不喜欢,我们都会投资 GPU。”囤积硬件并不是一个新现象,一旦库存足够大以至于需求下降,就会成为重置的催化剂。
OpenAI 仍然占据着 AI 收入的最大份额:The Information 最近报道称,OpenAI 的收入现在为34 亿美元,高于 2023 年底的 16 亿美元。虽然我们已经看到少数初创公司的收入规模达到不到 1 亿美元,但 OpenAI 与其他公司之间的差距仍然很大。除了 ChatGPT,消费者今天真正使用了多少 AI 产品?想想你每月 15.49 美元从 Netflix 或 11.99 美元从 Spotify 获得多少价值。从长远来看,AI 公司需要为消费者提供巨大的价值,才能继续掏钱。
1250 亿美元的缺口现在变成了 5000 亿美元的缺口:在最后的分析中,我慷慨地假设谷歌、微软、苹果和 Meta 每年都能从新的 AI 相关收入中产生 100 亿美元。我还假设甲骨文、字节跳动、阿里巴巴、腾讯、X 和特斯拉每年都有 50 亿美元的新 AI 收入。即使这仍然是正确的,并且我们在名单上再添加几家公司,1250 亿美元的缺口现在也会变成 5000 亿美元的缺口。
这还没完——B100 即将问世:今年早些时候,Nvidia 宣布推出 B100 芯片,其性能提升了 2.5 倍,而成本仅增加了 25%。我预计这将导致 NVDA 芯片需求的最终激增。与 H100 相比,B100 的成本与性能相比有了显著的改善,而且由于每个人都想在今年晚些时候买到 B100,因此很可能再次出现供应短缺。
对我上一篇文章的主要反驳之一是“GPU 资本支出就像修建铁路”,最终火车会开过来,目的地也会到来——新的农业出口、游乐园、购物中心等。我其实也同意这一点,但我认为它忽略了几点:
缺乏定价权:在物理基础设施建设的情况下,您正在建设的基础设施具有一些内在价值。如果您拥有旧金山和洛杉矶之间的轨道,那么您可能拥有某种垄断定价权,因为 A 地和 B 地之间只能铺设这么多轨道。在 GPU 数据中心的情况下,定价权要小得多。GPU 计算正日益成为一种按小时计量的商品。与成为寡头垄断的 CPU 云不同,构建专用 AI 云的新进入者继续涌入市场。在没有垄断或寡头垄断的情况下,高固定成本 + 低边际成本的企业几乎总是会看到价格竞争到边际成本(例如航空公司)。
投资浪费:即使是铁路行业,以及许多新技术行业,投机性投资狂潮也常常导致高额的资本浪费。《推动市场的引擎》是技术投资方面最好的教科书之一,其主要观点(确实,重点关注铁路行业)是,许多人在投机性技术浪潮中损失惨重。挑选赢家很难,但挑选输家(就铁路行业而言,运河)要容易得多。
折旧:从技术发展史中我们得知,半导体趋于越来越好。Nvidia 将继续生产更好的下一代芯片,如 B100。这将导致上一代芯片的折旧速度加快。由于市场低估了 B100 和下一代芯片的改进速度,因此它高估了今天购买的 H100 在 3-4 年后的价值。同样,物理基础设施不存在这种相似性,它不遵循任何“摩尔定律”类型的曲线,因此成本与性能的关系不断改善。
赢家与输家:我认为我们需要仔细研究赢家和输家——在基础设施建设过剩的时期,总会有赢家。人工智能很可能是下一波变革性技术浪潮,正如我在上一篇文章中提到的,GPU 计算价格的下降实际上有利于长期创新,也有利于初创企业。如果我的预测成真,它将主要对投资者造成伤害。创始人和公司建设者将继续在人工智能领域发展——他们将更有可能取得成功,因为他们将受益于较低的成本和在这一试验期间积累的经验。
人工智能将创造巨大的经济价值。专注于为最终用户提供价值的公司创建者将获得丰厚的回报。我们正在经历一场可能定义一代人的技术浪潮。像 Nvidia 这样的公司在推动这一转变方面发挥了重要作用,值得称赞,并且很可能在未来很长一段时间内在生态系统中发挥关键作用。
投机狂潮是技术的一部分,所以没什么好害怕的。那些在这一刻保持头脑清醒的人有机会建立极其重要的公司。但我们需要确保不要相信现在已经从硅谷蔓延到全国乃至全世界的妄想。这种妄想认为我们都会快速致富,因为 AGI 明天就会到来,我们都需要储存唯一有价值的资源,那就是 GPU。
事实上,前面的道路将是漫长的。它将充满坎坷和起伏。但几乎可以肯定,这将是值得的。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。