被马斯克断言‘成功率0%’,Sam Altman如何将一个‘疯狂想法’打造成AI帝国OpenAI?
目录
原版访谈:https://www.youtube.com/watch?v=V979Wd1gmTU
本文根据访谈内容,整理记录大佬的经历与思想。
大家好,我是凌顺,一个致力于把开源硬件玩出花、AI技术讲人话的科技创作者。
OpenAI的诞生:一个疯狂但坚定的开始
当我们说出那句话——“好吧,我们准备投身于AGI(通用人工智能)”——世界上99%的人都认为我们疯了。但有1%的人,这个想法真切地触动了他们。
你知道,在未来10年或20年,除非发生极其严重的错误,我们将拥有难以想象的超级智能。而现在,这是有史以来,技术史上创办公司的最佳时机,没有之一。
“几乎不可能”的决定
(Sam),非常感谢你加入我们,也感谢你带来的所有启发。我的意思是,OpenAI本身对任何一个真正有野心的人来说,都是一个真实的激励。或许我们就从这里开始吧。在公司早期,有哪些看似微小,后来却被证明是极其关键的决定?
说真的,仅仅是决定去做这件事,就是一个重大的决定。 我们当时差一点就没有启动OpenAI了。
在那个时候,AGI 听起来像个疯狂的想法。我当时还在做 Gary(采访者)现在的工作(Y Combinator总裁),你知道,当时有太多其他看起来很棒、肯定能成功的事情可以做,有那么多优秀的创业公司。而 AGI 就像是一个不切实际的“白日梦”。而且,即便它有可能实现,DeepMind 当时看起来也已经遥遥领先,强大到不可能被超越。
所以在 2015 年,我们花了一整年的时间讨论是否要启动这个项目。你知道,这就像抛硬币一样,充满了不确定性。我想,这就是许多宏伟事业的开端故事:它们看起来如此艰难,有太多充分的理由不去做,以至于它真的需要一个核心团队,大家坐在一个房间里,看着彼此的眼睛,然后说:“好吧,就这么干了。” 这些时刻至关重要。我的看法是,当你在犹豫不决时,你应该选择向前一步,投身其中。
当时有无数个理由,人们会告诉你为什么不该做这件事。比如,你后来才发现的 scaling laws(规模法则),在当时根本没人知道。
很难想象当时的情景是怎样的。明年将是我们的十周年纪念日。但回想十年前大家对AI的“感觉”,那是在第一个能用的大语言模型出现之前很久。我们当时在尝试玩电子游戏,还有一个只能勉强拼好魔方的小机械手。我们没有任何产品构想,没有收入,甚至完全不知道未来是否能有收入。我们只是坐在会议桌和白板前,绞尽脑汁地想一些可以写成论文的点子。
那种感觉现在很难解释,因为一切在今天看来都如此显而易见。但在当时,它看起来是如此不可能,像 ChatGPT 这样的想法完全属于科幻小说的范畴。
独特的使命与人才的聚集
有一件事让我印象深刻,你当时围绕着“应该致力于AGI”这个理念,将世界上最聪明的一群人聚集了起来。
其实,第二部分(吸引人才)比听起来要容易一些。如果你说,我们要做一件疯狂、令人兴奋、一旦成功就意义重大的事情,而且别人都还没在做,你其实很容易就能把很多人聚在一起。
结果证明,在那1%相信我们的人中,有很多是真正的聪明人。而且当时,他们几乎没有其他地方可去。所以我们能够真正地集中这些顶尖人才。这是一个人们真正在乎的使命。因此,尽管它看起来希望渺茫,但一旦成功,其价值将是巨大的。
我们在初创公司身上多次观察到这一点。如果你做的事情和别人一样,就很难集中人才,也很难让人们真正相信你的使命。 但如果你在做一个独一无二的(one-of-one)事情,你就会拥有非常好的顺风优势。
当然,OpenAI也不是一开始就规模宏大。它最初只是房间里的8个人,然后是20个人,方向非常不明确,我们只是想努力写出一篇好的研究论文。那些最终变得无比巨大的事物,都不是以那种宏大的方式开始的。
我认为,梦想着“如果成功,它会变得巨大”很重要,但没有什么伟大的事物是一蹴而就的。Vinod Khosla 有一句我一直很喜欢的名言:“一个零收入的百万美元级初创公司和一个零收入的十亿美元级初创公司有天壤之别。”但它们的共同点是,收入都为零,都只是几个人坐在房间里,都只是想让第一个东西跑起来。
所以,对于尝试开创一番大事业,我唯一的建议是:选择一个市场,它看起来在未来的某个版本中,一旦成功,规模可能会变得巨大。但除此之外,你要做的就是在很长一段时间里,一步一个脚印地前进(one dumb foot in front of the other)。
创业黄金时代:抓住“产品悬殊”的机遇
当下是创业的最佳时机
我们正处在一个非常有趣的时期,这种情况我们已经有一段时间没遇到了。现在,模型的能力在这里(高处),而人们已经想出来构建的产品却在这里(低处)。即使模型不再进步(当然它们会的),也有大量的新东西可以去构建。这就是我所说的 product overhang(产品悬殊)。
不仅如此,就像上周 03
(GPT-4o) 的成本还是这周的五倍一样,这种(成本下降的)趋势会一直持续下去。我认为人们将会对性价比的提升速度感到震惊。我们很快也会有一个开源模型问世,我想你们所有人都会为之惊叹,它会比你们期望的要好得多。
所以,你看到的是一个这样的世界:模型能力进入了一个全新的领域,API成本将持续急剧下降,开源模型将变得极其出色。但我们还没有看到与 reasoning models(推理模型)能力相匹配的新产品创新浪潮。这很合理,因为它们还很新。但这正是一个绝佳的时机,去创办一家公司,利用这个新出现的事物——这个元素周期表上没人用过的新方块——来构建点什么。
“即时软件”与SaaS的未来
(采访者):我们在YC内部一直在讨论一个想法,不知道是好是坏,但可能会让很多想做B2B SaaS的软件工程师感到害怕。这个想法是,未来你有了底层的数据库,有一个用于访问控制和执行业务逻辑的API层,然后界面就是LLM本身。你的电脑实际上就是一个Agent,而软件是即时(Just-in-Time)生成的。对于复杂的流程,你直接下指令,它会为你生成一个代码构件或一个界面来完成你想做的事。
(Sam):那一定会发生的。
你看,有两种方式看待这个问题。首先,假设你们都在创业、已经创业或者考虑创业。我再说一遍,这是有史以来,技术史上创办公司的最佳时机,没有之一。
它之所以是最佳时机,部分原因就是因为大地正在震动 (the ground is shaking)。的确存在很多挑战。一方面,你可以看着“即时软件”这种趋势说:“我们是一家SaaS公司,现在所有代码都能在需要时即时生成了,这对我们意味着什么?”
创业公司的颠覆性优势
但你也可以换个角度看:是的,这会发生,但它会对所有人发生。而创业公司取胜的方式,是当它们能比大公司迭代得更快,并且成本更低时。 大公司有很多优势,但它们迭代非常缓慢。如果某件事变得非常便宜,那么大公司的很多优势就会消失。
你可以从不同角度看待所有这些问题。但我推荐的方式是:每个人都将面临相同的挑战和机遇。但是,当行业的时钟周期(clock cycle)发生如此剧烈的变化时,创业公司几乎总是赢家,而且我们可能从未见过变化如此剧烈的时候。从这个方向采取行动,我认为你们会处于一个非常有利的位置。
AI的未来图景:从界面消失到超级智能
消失的界面与“Her”式伴侣
很长一段时间里,ChatGPT就像一个谷歌的替代品。但现在,你开始看到一些新东西,你可以真正地把一项任务交给它,比如使用代码解释器 (Code Interpreter),让这个东西去执行一堆操作,然后带着一份方案回来找你。它就像一个非常初级的员工,可以独立工作一小段时间。
这正是人机交互(HCI)的未来。我认为科幻小说猜对了一点:界面最终会几乎消失 (the interface almost melts away)。
今天的语音接口之所以体验糟糕,是因为它们还不够好。但理论上,如果你能对电脑说:“这就是我今天想做的所有事,如果发生任何变化,我相信你能自行处理,不要打扰我。”而它真的做到了,你完全信任它。那将是一种几乎消失的界面,只在它像一个优秀的人类助理一样需要与你沟通时才出现。
我今天用手机时,感觉就像走在纽约时代广场,不断被人撞到。我爱我的手机,它是了不起的科技产品,但它太有压力了:这里一个通知,那里一个弹窗,各种鲜艳的颜色和闪烁的东西。我可以想象一个电脑大部分时间都“消失”的界面,它默默地做我需要的事,我完全信任它能出色地判断何时该呈现信息,何时不该,何时该代表我行动。
Memory(记忆)功能是我今年发布的功能里最喜欢的一个。我认为它是人们第一次可以窥见那个未来的地方:你将拥有一个实体,它了解你,连接你所有的数据,并主动帮助你。它会一直在后台运行,知道何时该给你发消息,何时该为你做事。这就是通往电影《Her》中那种AI伴侣的道路,它会逐渐到来。
这也是我们与Jony Ive这样伟大的设计师合作的原因。在过去50年里,计算机交互只经历过两次重大革命:一次是键盘、鼠标和屏幕,一次是触摸屏和手机。AI为第三次革命完全敞开了大门,而如果你要选一个人来赌谁能搞定这件事,他就是那个不二之选。
模型的融合、机器人与科学发现
我们看到像03
(GPT-4o)和04 mini
这样的推理模型,与像40
(Sora)这样的多模态模型在并行发展。当这两条线索融合时会发生什么?GPT-5及以后的愿景是什么?
我们的最终目标,虽然 GPT-5 不可能完全实现,是拥有一个集成的模型,它可以在需要时进行深度推理,也可以在需要时实时生成可交互的视频,甚至可以即时编写一个全新的App只为你使用。当一个模型拥有真正完全的多模态能力——完美的视频、完美的编码和深度推理——那将感觉像一种全新的、非常强大的计算机界面。
拥有了视觉、语音和推理能力,就离我们想要的机器人近了一大步。我们的策略一直是先“搞定AI大脑”,然后再把它连接到机器人上。但机器人的时代很快就要到来了。
我对于一个世界的到来感到非常兴奋:当你订阅最高等级的ChatGPT时,我们会免费送你一个仿人机器人。拥有能在真实世界做实际工作的机器人,这个未来会相当疯狂。我们离那一步已经不远了。我认为几年内,机器人将开始做一些超级有用的事情。想象一下,如果你用传统方式制造一百万个仿人机器人,它们能否运行整个供应链,从驾驶矿车、集装箱船到运营工厂,再到制造新的机器人?
而放眼更长远的未来,如果非要我选一件最让我兴奋的事,那就是AI用于科学发现 (AI for science)。我相信,从根本上说,所有可持续的长期经济增长,所有能让人们生活变得更美好的东西,都源于发现新科学。如果我们能用AI极大地提升新科学发现的速度,我相信这将为每个人的生活带来难以置信的进步和奇迹。
能源:智能的终极限制
说来有点不好意思,我一直痴迷于能源和AI,认为它们是两个最重要的事情。但我得承认,直到创办OpenAI之后,我才意识到它们会如此明显地关联在一起——能源最终会成为我们能拥有多少智能的根本限制因素。
我不知道自己当初怎么会忽略这一点。我过去真的认为它们是独立的:我们需要AI来提供所有想法,需要能源来让世界上的所有事情发生。现在,我痴迷于为AI寻找能源。
我一直很着迷于一张图表,它显示了在漫长的人类历史中,生活质量与能源的丰度和成本之间的相关性。这也是我最初痴迷于能源的重要原因。
我从未参加过欧洲那些“去增长” (Degrowth) 的会议,但我一直想去体验一次。我想坐在黑暗寒冷的房间里,听大家谈论一切有多糟糕,没有任何希望。我想体验一下那种心态,因为我从未感受过。这种心态是我最难认同的思潮之一。
很明显,这里(指现场的创业者们)是我的同类和我的世界。创业公司、旧金山、科技行业、AI的乐观主义……这是我的大脑自然所在的空间。我很难真正共情另一方,但我很确定:我们是对的,他们是错的。 我们相信技术能创造激进的富足 (Radical Abundance)。
给创业者的箴言:信念、招聘与护城河
如何在质疑声中保持信念
在面对大量反对意见时,要保持信念是极其困难的。那些说这很容易的人,并没有说实话。
我记得有一次,在OpenAI成立几年后,Elon Musk——他当时是我的偶像之一——给我们发了一封非常刻薄的邮件。我们当时刚给他看了GPT-1,他说我们的成功率是零,说我们完全是在走向失败。我记得那晚回家时心想:“万一他是对的呢?这太糟糕了。”你将自己的生命力倾注于此,而你尊敬的聪明人却告诉你,你完全错了。
对此我没有灵丹妙药,只能说,这真的很难,但随着时间的推移会变得容易很多。你们所有人都将经历这些,你只需要被打倒,再站起来,拍拍灰尘,继续前进。
同样重要的是,要有勇气去做那些“不时髦”(out of fashion),但却是你真正相信和在乎的事情。并且,要学会相信自己的直觉,并随着你决策能力的提升而不断加强这种信任。
招聘哲学:“寻找斜率,而非截距”
对于招聘,很多人问我该怎么做。我的经验是,招聘那些真正聪明、有驱动力、高效率并且能作为团队一员出色工作的人,这能让你走完90%的路。
尤其是在初创公司早期,我不相信应该聘请那些“非常资深、声名显赫的管理者”。我更愿意选择那些“年轻、坚韧,但明显能把事情搞定”(young, scrappy, but clearly get stuff done)的人,而不是履历极其光鲜的人。
我在看YC申请时,几乎从不看简历上的项目,比如你在谷歌工作过或上过某某大学。我总是直接去看:“你做过的最令人印象深刻的事情是什么?”
PB(Paul Buchheit)\有一句话,我希望是他的名言,因为我已经引用了很多次:**“招聘要看斜率,而非Y轴截距”(hire for slope, not y-intercept)**。我认为这是非常棒的建议。
创业公司的“护城河”在哪里?
(采访者):后台大家最常问的问题是:“我如何创办一家不被OpenAI碾压的创业公司?”
(Sam):我们不想碾压你们。我们想成为一个平台。我们会努力把ChatGPT做成最好的超级助理,但那只是我们面前机遇中的一小部分。当我们看到有人说“我要创业,做一个ChatGPT的翻版”时,我们会感到难过,因为我们认为自己能把这件事做得很好,而且我们有巨大的先发优势。
但除此之外,还有太多空间可以去探索。最持久的公司通常都不是在做和别人一样的事情。 这能给你时间去弄清楚伟大的产品是什么,如何在不得不回答“护城河”问题之前,先把技术构建起来。
我们自己也花了很长时间才弄清楚ChatGPT的护城河问题。在很长一段时间里,我们唯一的护城河就是“市场上唯一的产品”。后来,我们才逐渐建立了品牌、Memory功能、数据连接等真正具备防御性的东西。所以,先拥有市场上唯一的好东西,你就有了一个窗口期,你必须在这个窗口期内建立起你的护城河。
我敢打赌,这个房间里将会诞生一个比OpenAI更伟大的公司,而创办它的人,一定不是在做那五件人人都在谈论的事情。
最后的反思:创业如同育儿
我最近有了一个孩子,每个人都会告诉你一件事:这是你一生中做过的最美好的事,但同时也是最艰难的事。美好的部分远比你能想象的要好,而艰难的部分也同样如此。
这完全是真的。而这,也正是我对成为一名企业家的感受。
美好的部分真的非常棒,比你想象的还要好;而艰难的部分,则比任何人能向你描述的都要残酷得多,残酷到令人震惊。
而你,必须坚持下去。