【AI商业分享】转自红杉投资机构对于目前AI市场和发展的分享
科学家、历史学家和经济学家长期以来一直在研究创造寒武纪创新爆发的最佳条件。在生成式人工智能领域,我们达到了一个现代奇迹,我们这一代人的太空竞赛。
这一刻的铸就耗费了数十年的时间。六十年的摩尔定律赋予了我们处理艾克萨级数据的计算能力。四十年的互联网历史(由COVID加速)为我们提供了价值数万亿的培训数据。二十年的移动和云计算让每个人都能在手掌中拥有超级计算机。换句话说,数十年的技术进步积累起来,为生成式人工智能的起飞创造了必要的条件。
ChatGPT的崛起是点燃导火索的火花,释放了我们多年来未曾见过的创新密度和热情——也许是自互联网早期以来。在“脑力谷”中,这种令人窒息的兴奋尤为直观,那里的人工智能研究人员获得了摇滚明星的地位,黑客之家每个周末都充满了新的自主代理和陪伴聊天机器人。人工智能研究人员从谚语中的“车库黑客”转变为指挥数十亿美元计算能力的特种部队。arXiv印刷机变得如此高产,以至于研究人员半开玩笑地呼吁暂停新出版物,以便他们能赶上进度。
但很快,对人工智能的兴奋变成了近乎歇斯底里的狂热。突然间,每家公司都成为了“AI副驾驶”。我们的收件箱被“人工智能Salesforce”、“人工智能Adobe”和“人工智能Instagram”等无差别的推介填满。价值1亿美元的种子轮融资重现江湖。我们发现自己陷入了筹资、人才战争和GPU采购的不可持续的狂欢之中。
果不其然,裂缝开始显现。艺术家、作家和歌手对机器生成的知识产权的合法性提出了挑战。围绕伦理、监管和即将到来的超级智能的辩论占据了华盛顿的议题。而且,最令人担忧的是,硅谷内部开始悄然传播一种说法,即生成式人工智能实际上并没有用处。产品远远没有达到预期,这一点从糟糕的用户留存率就可以看出来。许多应用的终端用户需求开始趋于平稳。这难道只是又一次虚有其表的周期吗?
人工智能的不满之夏让批评者欣喜若狂地跳起了坟墓舞,让人想起了互联网早期的日子,1998年一位著名经济学家宣称:“到2005年,互联网对经济的影响将不会比传真机更大。”
不要误会——尽管有噪音、歇斯底里、不确定性和不满的气氛,生成式人工智能的起步比SaaS更成功,仅初创企业的收入就超过了10亿美元(SaaS市场达到同等规模花了数年,而不是几个月)。一些应用已经成为家喻户晓的名字:ChatGPT成为增长最快的应用,特别是在学生和开发者中具有特别强的产品市场契合度;Midjourney成为我们集体的创意缪斯,据报道,仅凭11人的团队就实现了数亿美元的收入;Character将AI娱乐和陪伴性人格化,创造了我们最渴望的消费者“社交”应用——用户平均在应用中花费两个小时。
尽管如此,这些早期的成功迹象并没有改变这样一个现实:许多人工智能公司根本没有产品市场契合度或可持续的竞争优势,而且人工智能生态系统的整体繁荣是不可持续的。
现在尘埃已经稍微落定,我们认为这是一个适时的时刻来放大视角,反思生成式人工智能——我们今天所处的位置,以及我们可能的前进方向。
走向第二幕
生成式人工智能的第一年——“第一幕”——来自技术的出现。我们发现了一个新的“锤子”——基础模型——并释放了一波新奇应用的浪潮,这些应用是酷炫新技术的轻量级演示。
我们现在相信市场正在进入“第二幕”——将从客户反馈中来。第二幕将端到端解决人类问题。这些应用与第一幕推出的应用在性质上有所不同。它们倾向于将基础模型作为更全面解决方案的一部分,而不是整个解决方案。它们引入了新的编辑界面,使工作流程更加粘性,输出更好。它们通常是多模态的。
市场已经开始从“第一幕”过渡到“第二幕”。进入“第二幕”的公司示例包括Harvey,它正在为顶尖律师事务所构建定制的LLM;Glean,它正在爬取和索引我们的工作空间,使生成式人工智能在工作中更加相关;以及Character和Ava,它们正在创造数字伴侣。
市场地图
下面是我们更新后的生成式人工智能市场地图。
与去年的地图不同,我们选择按用例而不是模型模态来组织这张地图。这反映了市场上两个重要的趋势:生成式人工智能从技术锤子到实际用例和价值的演变,以及生成式人工智能应用日益多模态的性质。
此外,我们还包含了一个新的大型语言模型(LLM)开发者工具栈,它反映了公司在生产中构建生成式人工智能应用时所依赖的计算和工具供应商。
重新审视我们的论点
我们最初的文章为生成式人工智能市场机会提出了一个论点,并对其市场发展方式提出了一个假设。我们做得如何呢?
这是我们错的地方:
1、事情发展得很快。去年,我们预计在近十年内才会有实习生级别的代码生成、好莱坞质量的视频或听起来不像机械的人声。但是,只要快速听听TikTok上Eleven Labs的声音或Runway的AI电影节,就清楚地表明未来已经以超快的速度到来。即使是3D模型、游戏和音乐也正在迅速变得更好。
2、瓶颈在供应方面。我们没有预料到最终用户需求会如此超出GPU供应的程度。许多公司增长的瓶颈很快变成了不是客户需求,而是获取Nvidia最新GPU的能力。长时间的等待成为了常态,一个简单的商业模式出现了:支付订阅费以跳过排队并获取更好的模型。
3、垂直分离尚未发生。我们仍然相信,“应用层”公司和基础模型提供商之间将会有一个分离,模型公司专注于规模和研究,应用层公司专注于产品和用户界面。实际上,这种分离还没有干净地发生。事实上,最成功的面向用户的应用程序一开始就已经实现了垂直整合。
4、竞争激烈的环境和现有企业的迅速反应。去年,竞争格局中有少数几个过于拥挤的类别(尤其是图像生成和文案撰写),但总体而言市场还有很大的空白。今天,许多竞争角落的竞争比机会更多。现有企业的迅速反应,从谷歌的Duet和Bard到Adobe的Firefly——以及现有企业最终愿意“冒险”——加剧了竞争热度。即使在基础模型层面,我们也看到客户建立基础设施以在不同供应商之间保持中立。
5、护城河在客户,而不是数据中。我们预测,最优秀的生成式AI公司可以通过数据飞轮产生可持续的竞争优势:更多使用 → 更多数据 → 更好的模型 → 更多使用。虽然这在一定程度上仍然正确,特别是在那些具有非常专业化和难以获得的数据的领域,但“数据护城河”的基础是不稳定的:应用公司生成的数据并没有创造一个不可逾越的护城河,下一代基础模型很可能会彻底摧毁初创公司产生的任何数据护城河。相反,工作流程和用户网络似乎是创造更持久竞争优势的来源。
这是我们对的地方:
1、生成式AI是真实存在的。突然之间,每个开发者都在开发生成式AI应用程序,每个企业买家都在要求它。市场甚至保留了“生成式AI”的名称。人才和风险投资资金流入了市场。生成式AI甚至在像“哈利波特巴黎世家”或Ghostwriter的Drake模仿歌曲“Heart on My Sleeve”这样的病毒视频中成为了流行文化现象,后者已成为排行榜热门。
2、第一批杀手级应用已经出现。已经有充分记录表明,ChatGPT是最快达到1亿月活跃用户的应用——它仅用了6周的时间就有机地做到了这一点。相比之下,Instagram花了2.5年,WhatsApp花了3.5年,YouTube和Facebook花了4年才达到那种用户需求水平。但ChatGPT并不是一个孤立的现象。Character AI的参与度(平均会话时间为2小时)、Github Copilot的生产效益(效率提高55%)以及Midjourney的盈利路径(数亿美元的收入)都表明第一批杀手级应用已经到来。
3、开发者是关键。像Stripe或Unity这样的以开发者为先的公司的核心洞察之一是,开发者的接入打开了你甚至无法想象的用例。在过去的几个季度中,我们被推介了从音乐生成社区到AI媒人到AI客户支持代理等各种事物。
4、产品形态正在演变。AI应用的最初版本主要是自动完成和初稿,但这些产品形态现在正在变得更加复杂。Midjourney引入的相机平移和填充很好地说明了以生成式AI为先的用户体验如何变得更加丰富。在各个领域,产品形态正在从个体层面演变为系统级别的生产力,从人在循环中到面向执行的代理系统。
5、版权、伦理和存在的恐惧。关于这些热点话题的辩论一直在进行。艺术家、作家和音乐家意见分歧,一些创作者对其他人从衍生作品中获利感到愤慨,而一些创作者则拥抱新的AI现实(想到Grimes的利润分享提议和James Buckhouse对成为创意基因组一部分的乐观态度)。没有一家初创公司想成为最终Spotify的Napster或Limewire(感谢Jason Boehmig)。规则是不透明的:日本宣布用于训练AI的内容没有知识产权,而欧洲则提出了严厉的监管提议。
我们现在处于什么位置?生成式AI的价值问题
生成式AI并不缺乏用例或客户需求。用户渴望让工作更轻松、工作成果更好的AI,这就是为什么他们蜂拥而至地使用应用程序(尽管缺乏自然的分发渠道)。
但是人们会留下来吗?并不真的。下面的图表比较了以AI为先的应用在第一个月的移动应用留存率与现有公司的情况。
用户参与度也显得不够活跃。一些最优秀的消费者公司拥有60-65%的日活跃用户与月活跃用户比(DAU/MAU);WhatsApp的比例是85%。相比之下,生成式AI应用的中位数只有14%(值得注意的例外是Character和“AI陪伴”类别)。这意味着用户尚未在生成式AI产品中找到足够的价值,以至于每天都使用它们。
简而言之,生成式人工智能最大的问题不在于寻找用例、需求或分发渠道,而在于证明其价值。正如我们的同事David Cahn所写,“2000亿美元的问题是:你打算用所有这些基础设施做什么?它将如何改变人们的生活?”建立持久企业的路径将需要解决留存问题,并为客户创造足够深的价值,使他们坚持使用并成为日常活跃用户。
让我们不要感到绝望。生成式AI仍处于“尴尬的青少年时期”。有才华的闪现,当产品未能达到预期时,失败通常是可靠的、可重复的和可修复的。我们的工作才刚刚开始。
第二幕:共享的剧本
创始人们正在开始艰苦的提示工程、微调和数据集策划工作,以使他们的AI产品变得优秀。他们正在逐块构建华丽的演示,转化为完整的产品体验。与此同时,基础模型底层继续充满研究和创新。
随着公司找到持久价值的路径,共享的剧本正在形成。我们现在有了使模型有用的共享技术,以及将塑造生成式AI第二幕的新兴UI范式。
模型开发栈
- 新兴的推理技术,如思维链、思维树和反思,正在提高模型执行更丰富、更复杂的推理任务的能力,缩小了客户期望与模型能力之间的差距。开发者正在使用像Langchain这样的框架来调用和调试更复杂的多链序列。
- 像RLHF和微调这样的迁移学习技术变得更加易于访问,尤其是随着最近对GPT-3.5和Llama-2的微调功能的提供,这意味着公司可以将基础模型适应于他们特定的领域,并从用户反馈中改进。开发者正在从Hugging Face下载开源模型并对它们进行微调,以实现高质量的性能。
- 检索增强生成正在引入有关业务或用户的上下文,减少幻觉并增加真实性和实用性。像Pinecone这样的公司的向量数据库已成为RAG的基础设施支柱。
- 新的开发工具和应用框架为公司提供了可重用的构建块,以创建更高级的AI应用,并帮助开发者评估、改进和监控生产中AI模型的性能,包括像Langsmith和Weights & Biases这样的LLMOps工具。
- 像Coreweave、Lambda Labs、Foundry、Replicate和Modal这样的AI优先基础设施公司正在解绑公共云,并提供AI公司最需要的东西:以合理的成本提供充足的GPU,按需可用且高度可扩展,同时提供良好的PaaS开发者体验。
这些技术应该会缩小模型的期望与现实之间的差距,同时基础模型也在不断改进。但是,让模型变得出色只是战斗的一半。生成式AI优先用户体验的剧本也在演变:
新兴的产品蓝图
- 生成式界面。基于文本的对话用户体验是LLM顶层的默认界面。逐渐地,新的形式因素正在进入武器库,从Perplexity的生成式用户界面到Inflection AI的听起来像人声的新模态。
- 新的编辑体验:从Copilot到导演模式。随着我们从零次射击到询问和调整(感谢Zach Lloyd),生成式AI公司正在发明一套与传统编辑工作流程截然不同的新旋钮和开关。Midjourney的新平移命令和Runway的导演模式创造了新的类似相机的编辑体验。Eleven Labs使得通过提示操纵声音成为可能。
- 越来越复杂的代理系统。生成式AI应用越来越不仅仅是自动完成或供人类审核的初稿;它们现在有了自主解决问题、访问外部工具并代表我们端到端解决问题的能力。我们正在稳步从0级自主进步到5级自主。
- 系统范围的优化。与其嵌入单个人类用户的工作流程并使该个体更有效率,一些公司正在直接解决系统范围的优化问题。你能否摘下一堆支持票据或拉取请求并自主解决它们,从而使整个系统更有效?
最后的思考
随着我们接近前沿悖论,随着变压器和扩散模型的新奇性消退,生成式AI市场的性质正在演变。炒作和闪光正在让位于真正的价值和完整的产品体验。
然而,Amara法则——我们倾向于在短期内高估一项技术的效果,在长期内低估效果——正在发挥作用。我们在投资决策中保持耐心和判断,密切关注创始人如何解决价值问题。共享剧本的公司正在推动模型性能和产品体验的边界,这让我们对生成式AI的第二幕充满乐观。
文章转自:https://www.sequoiacap.com/article/generative-ai-act-two/
文章借助大模型工具翻译,整体效果不错