查看原文
其他

【万字实录】黄仁勋Nvidia总部创业分享:未来开发者与专有模型是什么样子?创业者如何平衡短期与长期利益?老黄的皮大衣怎么来的?

有新 有新Newin 2023-10-09


英伟达在上周结束了发布会,上月更早的时候,硅谷的两位知名投资人 Sarah Guo 和 Elad Gil 就与 Jensen Huang(黄仁勋)在英伟达圣克拉拉的总部办公室展开了一次对话。


在对话中,Jensen Huang 讨论了更广泛的平台转变对开发者的意义,谈到了NVIDIA对气候和生物制药等领域的长期投资,这些领域将受益于人工智能的创新应用,上周发布的下一代芯片Hopper,以及英伟达为何以及如何选择解决当前无法解决的问题,并在对话末尾留了一个有趣的彩蛋~


这次对话分为 9 个话题,如下:


  1. Nvidia的起源

  2. Nvidia的AI优势与发展之道

  3. 从游戏跨界 Crypto 与AI

  4. 更广泛的计算机科学转变

  5. 未来的开发者与专有模型

  6. 未来与现在,老黄 30 年的信念

  7. AI 对于组织,形式追随功能

  8. 信念,磨难,遗忘与继续前进

  9. 未来 10 年,深耕科研基础模型


大家 enjoy~


Nvidia 的起源


Sarah Guo:

我们从一开始说起,你在创办公司之前曾在 LSI(Large Scale Integration)和 AMD(Advanced Micro Devices)工作过,是什么样的经历呢?


Jensen Huang:

他们给了我一份工作。我当时在俄勒冈州立大学,参加了学校组织的公司招聘日,面试了很多公司。有两家公司让我印象深刻,我喜欢设计芯片和计算机,当时我们计算机科学实验室贴着一张 AMD 的 32 位 CPU 29000的海报,我一直觉得能够设计那样的芯片很酷,还有一家由硅谷的初创公司,他们使用软件设计芯片,而不是手工设计,采用可编程逻辑,通过描述语言合成芯片。


我选择去了 AMD ,在那里设计微处理器,而我的办公室同事去了 LSI,她去了之后, LSI 团队告诉我他们也希望我来 LSI Logic 工作,在前同事的邀请下,我决定去 LSI ,因为那是电子设计自动化行业的起步阶段,是用计算机设计芯片的开始,那可能是我经历过的最好的事情之一,也是每家公司都能够自研芯片的开始。


那时候我有机会遇到一些优秀的计算机架构师,比如 Andy Bechtolsheim 是 Sun 的创始人,我也有幸与一些在Silicon Graphics 工作的杰出架构师合作过,比如 John Rubenstein,他曾在 Dana Computer 工作,后来成为苹果的副总裁。


所以在很小的时候,我就有机会与一些了不起的计算机架构师一起工作,从中学到了很多关于使用芯片构建计算机的知识,那是我早期的经历。


Sarah Guo:

你们什么时候意识到必须创办一家公司呢?


Jensen Huang:

那不是我的主意,是 Chris 和 Curtis 的想法,他们想离开 Sun ,而我在 LSI  Logic 工作得很好,我喜欢我的工作,我和 Lori 有两个孩子,就像你一样,他们不停地告诉我说他们想创办一家公司,真的需要我加入,我当时告诉他们我真的需要一份工作,无论如何,在创办之前他们需要想清楚怎么做。


当时,计算机设计的价值在通用计算和使用加速器之间存在差异,大约 99% 的人相信通用计算,只有约 1% 的人相信加速器,在过去的25年里,99% 的人是正确的,所以我们决定创办一家加速计算的公司。


当时,加速计算能做的事情主要是解决那些通用计算难以解决甚至无法解决的问题,我们的公司致力于解决那些普通计算机无法解决的问题。如果追溯这个使命的最终目标,我们走向了无人驾驶汽车、机器人、气候科学问题、数字生物学等领域。当然,最著名的领域之一就是 AI 。


AI 优势与发展之道


Sarah Guo:

所以在当前 AI 热潮之前,你们已经在广泛的应用领域工作了。Nvidia 在 AI 方面最初的技术优势是什么?你们是什么时候开始意识到这将成为重要的应用场景呢?


Jensen Huang:

我们扩展了我们加速器的灵活性,使其更具通用性。我们发明了一种名为  CUDA 的新的计算模型。


Elad Gil:

这是非常令人兴奋的新技术。


Jensen Huang:

我们需要一些加速计算,并希望我们的图形处理器变得越来越通用。一开始的原因是我们需要进行通用图像处理和后期效果相关的工作,例如你渲染图像然后进行后期效果处理,当然还有其他应用,我们希望给场景带来生机,所以我们必须进行物理处理,进行物理计算,有粒子物理、流体力学等等,因此我们扩大了加速计算平台的应用范围,使其变得越来越通用。


通用性的问题在于,你越通用,你在特定领域的加速效果就越低,所以必须非常小心地找到那条线,这是我们公司的一个天赋,找到在一方面每一代产品都能给应用程序带来巨大的加速效果,远远超过 CPU 的能力,但是如果变得过于通用,就像 CPU 一样,如何用 CPU 来加速 CPU 呢?所以必须找到一种方法来平衡。


另一方面,如果不扩大你所服务的应用领域,能够产生的研发资金就不足以赶上 CPU ,因为 CPU 是全球研发预算最大的芯片,想一下这个问题,实际上几乎是不可能的,因为有一个规模较小的应用市场,我们称之为 10 亿美元市场,在这个 10 亿美元市场中,你每年投资 1.5 亿美元,如何跟上几千亿美元规模的行业?这甚至是不合理的。


所以必须非常小心地找到那个非常细小的市场,使得 1.5 亿美元能够异常地和疯狂地加速这个特定的应用,然后随着时间的推移,可以扩大应用范围,使市场规模从 10 亿美元增长到 50~100亿美元,而不会掉进那个悬崖,这是我们努力寻找的平衡点,所以我们不断扩大通用性,这让我们进入了分子动力学模拟领域,就像这张图片看起来的样子,地震处理是另一个行业,通过这样一点一滴的努力,我们扩大了应用范围。


我们做得不错的一点是确保无论使用我们的平台进行通用计算还是加速计算,始终保持架构的兼容性,原因是因为我们希望有一个能吸引开发者的平台;如果全球每一款 Nvidia 芯片都不兼容,开发者怎么能选择一款呢?即使他们了解到  CUDA 对他们来说很重要,他们该选择哪个芯片来开发应用呢?没有人能够弄清楚。


所以,如果我们相信这个架构,如果我们希望它成为一个新的计算平台,那就让我们确保我们的每一款芯片的性能完全相同,就像 x86、ARM 或任何计算平台一样,所以在最开始的 5~10 年里,我们的  CUDA 客户很少,但我们使每一款芯片都兼容  CUDA ,你可以回顾历史,看看我们的毛利率,开始时很低,然后变得更低,因为我们处在一个竞争激烈的行业中,我们仍在努力摸索如何做好我们的工作并建造成本效益高的产品,这本身就很具挑战性,然后我们又把它叠加在 CUDA 架构上,这个架构没有应用,就没有人为它买单。


Elad Gil:

这真是令人惊讶,因为现在当我与 AI 界的人交谈时,他们非常喜欢使用 Nvidia 的GPU,原因之一是因为 CUDA 和可扩展互联的能力,所以你可以高度并行化这些处理,这是其他方法或现有市场上的架构无法做到的。


Jensen Huang:

这个计算平台带来了一些奇迹般的效果。我们将它通过  Geforce这张游戏卡带给全世界,这是  Geoffrey Hinton  实验室的第一款 GPU,想象一下,Jeff走进来说:“这是几张GPU,叫做 Geforce,你们应该试着用它来进行深度神经网络的训练”,但当时它仅仅是一张游戏卡。


从游戏跨界 Crypto 与AI


Elad Gil:

你当初有哪些应用想法?因为从你的观点来看,你从90年代开始创办公司时,从非常受欢迎但游戏领域开始,然后我开始越来越多地听到有关 Nvidia  GPU 的消息,无论是在加密货币和挖矿的背景下,还是在 AI 的背景下,似乎这是两个市场,许多人都自然而然地选择了你们的产品,是因为你们针对这些群体进行市场营销吗?还是人们开始意识到他们需要的产品呢?


Jensen Huang:

这就是计算平台的美妙之处,对吧?一开始你必须针对应用进行定位,我们做的第一个应用之一是地震处理,它们都是那种粒子物理学的应用;另一个是图像处理以及逆物理学,在一个特定的领域,我们只是去找人进行研究,我们去科学计算中心,问他们有哪些超出他们能力范围的问题?应用领域的清单包括量子化学、量子物理等等。


Elad Gil:

那么你什么时候意识到,哇,这个 AI 的东西对我们来说真的很重要。


Jensen Huang:

我想大约是在 2012 年吧。同时,Andrew Ang 联系了我们的首席科学家 Bill Daly,希望找到一种方法将他们正在研究的神经网络模型放入 GPU 中,这样他们就可以用几个 GPU 来进行训练,而不是使用成千上万台 CPU 服务器。几乎同时, Geoffrey Hinton  也联系了我们,我们开始听说这方面的事情,而且 Yann LeCun 在他的实验室也发生了同样的事情,所以在几个不同的实验室里,我们同时感受到了这种神经网络的出现,这引起了我们的注意。


Elad Gil:

我想 2012 年也是 AlexNet 发布的一年,我觉得那真的是深度学习的一个转折点,至少在我记忆中,我认为那是一个令人激动的 AI 浪潮的开始,然后我觉得在接下来的 10 年里,创业公司并没有真正发生什么,但很多老牌公司开始采用这种技术。


Jensen Huang:

我们在之前就开始感受到了,也听说过了,有一张图片吸引了我们所有人的注意力。


Sarah Guo:

你曾经提到过早期的 AI 实验室使用 Nvidia 的游戏卡,因为你们解决了其他人无法解决的问题,并提高了效率和规模,在 Nvidia 开始投资某个应用程序时,他们是认为这是一个不断增长的应用程序,还是更像是一个平台,市场会接受它呢?


Jensen Huang:

不是的。每次一个应用程序得到应用时,我们都会问自己,如何让它变得更好?这次是在深度学习方面,我们作出的重要观察是,这不仅仅是一个用于计算机视觉的新算法,虽然它在一开始主要应用在计算机视觉上,这对我们来说非常有帮助。如果仅仅是计算机视觉,我们可以将它用于各种有趣的应用,比如自动驾驶汽车和机器人技术。


我们确实使用了它,但发现这可能是一种全新的软件编写方式,并且我们问自己,这对芯片设计、系统设计、互连、算法和系统软件有什么影响,以便真正思考的不仅仅是这个领域为什么如此令人兴奋,它为什么如此有效,这在本质上是个奇迹,ImageNet 在没有任何人为设计的特定算法的情况下,与 30 年的计算机视觉算法相比,一夜之间就达到了相当高的准确性,这是一次飞跃。


首先,我们要问的问题是它为什么如此有效?它是否可扩展?如果它可扩展,那对计算机科学的其他领域有什么影响?这个能解决高维度问题的通用函数,只需要足够的数据进行训练,当时我们相信可以得到足够的数据,以及将这个模型系统地逐层训练到一个良好的状态。


更广泛的计算机科学转变


Elad Gil:

你能更详细地谈谈你是如何看待这种更广泛的计算机科学转变的吗?比如页面是如何生成和服务的,还有其他方面的变化,与 AI 的转变相关的。


Jensen Huang:

现在快进 10 年,前 5 年我们一直在思考整个计算机科学的影响。与此同时,我们开发了各种新模型,从卷积神经网络到循环神经网络,再到长短期记忆网络,还有其他各种新模型,并且将它们扩展得越来越大,在感知模型方面取得了很大进展。当然, Transformer 是一个重要的里程碑,BERT 也是一个重要的里程碑,你们都对这个故事非常了解。


Sarah Guo:

在 Transformer s和 BERT 等方面,你们是否看到了量的增长的变化?因为感觉这种具备注意力机制的架构使得模型的规模化成为可能,这也是产业发展的推动力。


Jensen Huang:

嗯,你能够从空间数据和顺序数据中学习模式和关系,这一定是一种非常有效的架构,所以我认为从基本原理上来说,你可以想象 Transformer 会是一个重要的突破。此外,你可以并行训练它,真正将这个模型扩展起来,这非常令人兴奋。


我认为当 Transformer 首次问世时,我们意识到它克服了循环神经网络和长短期记忆网络的局限性,我们现在可以以一种非常大规模的方式学习顺序数据。这非常令人兴奋,BERT 也非常令人兴奋,我们自己训练了一些早期的语言模型,取得了非常好的结果,但直到结合了强化学习和人类反馈,以及与检索模型、对话管理等方面的突破性工作结合起来,我们才真正看到了一些重大进展。


直到各种要素开始融合,我们才意识到编程语言已经完全改变了。现在,在计算的历史上,编程计算机的语言是人类的语言,可以是任何一种人类语言,而且甚至不需要语法正确,任何人都可以编写计算机程序,这是一件了不起的事情。


这是个大问题,因为你以不同的方式编程,它会写出不同的应用程序,这种新的计算模型的影响有多大?显然非常大,这也是为什么 ChatGPT 是历史上发展最快的应用程序的原因。


Sarah Guo:

我们在节目中还有 Alex gravely,他是联合编写者的首席架构师,他最喜欢的用例是一些人告诉他他们以前不会编程,现在却可以了,我认为这种情况非常民主化。


Jensen Huang:

真是令人惊奇,你可以给 ChatGPT 提供一个问题,它会逐步推理,但最后得出了错误的答案;但另一方面,你可以让它写一个解决同样问题的程序,它却能完美地解决问题,这种应用既可以推理解决问题,做得相当不错,已经非常接近了;另一方面,它也可以完全写出一个解决相同问题的程序,你必须真正思考一下这个意义。


Elad Gil:

将它看作未来世界的某种形式的机器感知。


Jensen Huang:

从技术上讲,我不知道那个词是什么意思,但我相信我们现在拥有一种软件,它能够推理和解决许多类型的问题,并且能够持续不断地提供解决方案或程序。


未来的开发者与专有模型


Elad Gil: 

那么,展望未来,你如何考虑 Nvidia 的业务发展方向?你过去提到过 Nvidia 在训练模型方面做了一些非常有趣的事情,这将是你未来主要关注的一部分吗?还是主要关注芯片方面?你如何考虑推动研究并成为行业的基础平台的这种组合?


Jensen Huang:

我们是一家计算平台公司,我们必须向上游发展,以满足开发者的需求,问题聚焦在谁是开发者?起初,开发者是控制自己操作系统的人,所以在那些日子里,我们可能只需要到达设备驱动程序或稍微低一些的层面,以某种方式使开发者能够使用。


对于科学计算和其他各种领域,开发者实际上正在使用某个求解器,他们需要将该领域的算法以某种方式表达出来,以便进行加速,这就是为什么当我们涉足多领域物理问题时,我们意识到我们必须开发算法本身,因为解决问题的算法与底层的计算机架构相关。架构的 CPU 通过以太网连接在一起,那个算法肯定与通过一个 GPU 内部的网络连接的数千个处理器以及数据中心内的数千个 GPU 不同。


显然,算法必须被重新构建和重组。所以我们的公司在设计计算机算法方面非常擅长,可以是粒子物理学或流体力学的算法,当然也包括深度学习和神经网络。CUDA 实际上是一种用于加速深度学习的领域专用语言,我们已经为深度神经网络和光线追踪等计算机图形学做过这种工作,所有这些不同的领域库实际上是为了理解科学领域并重新设计算法,使其运行速度非常快。


现在,未来的开发者是什么样的呢?我认为未来的开发者可能会使用大型语言模型或基础模型。如果有人能够通过微软使用 ChatGPT 或 OpenAI 的模型,我非常鼓励;如果有人能够通过谷歌使用它,我也非常鼓励。但是,如果有人需要为某个领域构建一个专有模型,可能需要创建一个新的基础模型,比如领域是蛋白质,或者领域是化学,或者领域是气候科学,或者是多物理学,那种基础模型是相当专业的,虽然它不是一个小市场,显然,因为药物发现领域很大,气候科学领域也很大,气候技术领域也很大。然而,它不太可能对每个人都有广泛的用途。


因此,我们可能决定为 3D 图形、虚拟世界建立一个基础模型,因为它们对我们非常重要,我们可能决定为机器人技术建立一个基础模型,因为它涉及到我们非常擅长的领域交叉;即使如此,我们也可能只做到必要的程度,而不再深入,我们并不试图成为一个AI模型公司,我们试图帮助行业创建AI模型。


Elad Gil: 

非常有道理,基本上是跟随客户的需求。


Jensen Huang: 

是的,然后在适当的时候将其移交给他们。


我试图将这个原则与公司做出的一些非常长期的承诺相协调,比如 CUDA 是一个非常长期的赌注,我们10 年前见过面,当时 Nvidia 的估值是现在的 1/ 100,并且面临着激进投资者等压力;当然,在那时做出长期赌注可能有些困难。


未来与现在

老黄 30 年的信念


Elad Gil:

我想知道,你如何平衡作为一家大型上市公司的压力和当今的机会,以及架构承诺或长期赌注,并对此进行优先排序。


Jensen Huang:

投资未来和现在的可持续性并不冲突。对于所有初创公司和所有公司的 CEO 来说,挑战在于找到一种方法,能够以自己所信仰的核心信念为基础,并负担得起这样做,这就是公司的目的所在,所以这部分是信念,部分是技能。


赚钱不是信念的问题,赚钱是技能的问题。这是一种可学习的技能。我花了很长时间才学会它,我承认这一点。我已经从事这个工作30年了,在前面的 20 年中,我还在试图弄清楚,但这是一种技能,学会赚钱和有效地管理公司这些都是技能,公司必须发展这些技能。


我认为我们最终的做法是问自己,我们真的相信吗?如果我们真的相信做某件事,那么这就是公司的目的,是企业的唯一目的去追求自己的信仰,其他方面都取决于公司的聪明才智,尽力做好工作,建立人们愿意购买的产品,并尽可能提高成本效益,使公司更高效。这些都是技能。


艰难的部分,事实证明,不是技能部分。我花了很长时间才学会它,但很多公司都知道如何赚钱。显然,赚钱不是那么困难,其他人也可以做到,困难的是单一地推进一种新的计算模型,我们称之为加速计算。


我们相信,加速计算一方面可以帮助我们解决普通计算机无法解决的问题,另一方面它也为我们带来了许多令人惊叹的应用,比如我今天对数字生物学非常兴奋,比如我们对气候变化兴奋,对机器人技术和自动驾驶车辆也充满激情。如果不是因为我们追求那些在普通计算机上不可能的应用,我们为什么会发现所有这些东西?我们为什么会发现 AI ?为什么我们成为大型语言模型的工作么?因为大型语言模型几乎是不可能的。如果你在做一些几乎不可能的事情,就给我们打电话吧。我们可以提供工具帮你解决这些问题的,我希望我们能够发现这些未来的东西。


另一方面,我们深信,总有一天所有事物都会被加速,这是非常清楚的, CPU 将会达到极限,你无法无限地扩展通用计算,而且你总是需要它,总是需要 CPU ,但在未来,加速计算将是最佳前进方式。所以,从一开始,30年前,我们就坚信这一点,这也是我们创办公司的原因,这是真正的信念。


Sarah Guo: 

你对这个30年的信念得到了极大的证实,你肯定在公司经营的 30 年中的某个时刻,对自己的信念产生了怀疑。你是否曾经有过这样的经历?


Jensen Huang: 

你是说我不适合这份工作吗?


Sarah Guo:

不,我是指你是否对加速计算以及它的重要性产生过怀疑。


Jensen Huang:

第二个问题的答案是肯定的。首先,我不认为任何人应该认为他们适合这份工作,你几乎每天都应该审视自己,所以明确一点。


Sarah Guo:

这不是一个问题。


Jensen Huang: 

但我非常乐意回答这个问题,我是否曾经相信过自己是错误的?没有,我相信加速计算是唯一解决不可能问题的方法,这是显而易见的。


另一方面,如果你能解决今天不可能解决的问题,并且有一天你需要将该应用程序推广,加速计算是否是最佳途径?答案是肯定的。


Elad Gil:

你认为 CPU 何时达到极限?你提到,最终你认为一切都会转向加速计算,或者至少未来的很大一部分会转向加速计算。这需要 5 年还是 10 年?


Jensen Huang: 

对于某些应用程序,这已经在 12 年前发生了,对吧?Geoffrey Hinton 、Yann LeCun 和 Andrew Ng 等人在12年前就发现了这是唯一的前进方向,而对于计算机图形学来说这是唯一的前进方向。


AI 对于组织

形式追随功能


Elad Gil: 

随着 AI 变得越来越重要,你组织和管理公司的方式发生了变化吗?你是否围绕此进行了业务方面的重新调整?或者你如何在这个环境中思考管理,因为事物变化得如此迅速,这个领域中有很多令人兴奋的事情发生?


Jensen Huang:

你问了一个很好的问题。如果退一步,公司的架构不应该是通用的,世界上的每家公司都不应该像美国军队一样建设;事实上,如果你看看世界上每家公司的组织结构,它们看起来都有点像美国军队,有个人在顶层,然后逐级下来,然而, CEO 的直接下属很少,那些刚学会管理一级管理者的人的直接下属很多,这与实际情况恰恰相反。


我的直接下属很出色,他们非常有才华,非常擅长自己的工作,是优秀的领导者。他们在商业方面有很好的眼光,有出色的远见,为什么呢?


Sarah Guo:

我猜这意味着你的管理层级可能不止是通常被接受的 6~7人之类的。


Jensen Huang: 

我有大约 40 个直接下属,没有 1 对 1 的会议,也没有职业指导,比如你希望用你的一生做什么?这些是你与新毕业生和早期职业者进行的对话;我们当然喜欢这些对话,帮助他们规划职业生涯,指导他们,并为他们提供新的经验,但在高层管理团队,我们组织起来同时追求许多不同的事情。


作为一家软件公司,你必须了解计算机架构,而计算机架构中最重要的一点是你只能承担一个。世界上最大的公司只有两个操作系统,地球上最大的公司只有两个操作系统,为什么这么多公司有这么多不同的计算机架构?它们保留了7~9 种指令集,我们只有 1 个指令集,我们只有一个计算机架构,我们对此非常纪律严明。所以我们需要集中精力。


在高级别上,我们允许创新和发现,所以我认为公司的组织结构符合我们工作的性质,这是最重要的事情,也可能是我在建设公司时学到的最重要的一点,没有通用的组织结构适用于每个公司,它应该适应公司的职能和目的,以及领导者的领导风格。


Elad Gil:

我认为这是一个非常重要的观点,大多数人并没有真正意识到公司几乎应该是一种定制的结构,支持 CEO 、员工以及公司向客户提供的服务,而不是总是相同的东西,完全正确,这被忽视了很多次。


Jensen Huang:

是的,除了某些特定的领导职位,你需要某个特定的首席,你需要某个特定的首席,但除此之外,你应该从第一原则出发,构建一个符合领导者和职能的结构。


Elad Gil: 

我在谷歌的时候,他们有著名的 80-20- 10 原则,80% 是核心,20% 是核心附加的新东西, 10 % 是超级实验性的,你是否有任何框架或思考这方面的方式,在我们构建的这个通用平台上诞生创新案例?


Jensen Huang:

我们公司有几个不同的部分,其中一个非常大的部分是设计和构建复杂的计算机,这是我们的主要任务之一。我们还有一些“秘密实验室”,因为我们试图提前 10 年发明一些我们不确定能否成功的东西,在这个过程中,需要不断调整和适应。我们公司有两种不同的工作方式:一种是灵活的,随时变化的。如果某项投资不成功,我们会放弃并将资源用在其他地方,这就是我们的敏捷部分;另一部分则更加精细,这两种工作方式必须并行运作。


Sarah Guo:

能否分享下一代处理器架构,以及其中最重要的创新和设计过程?


Jensen Huang: 

对于 hopper 来说,重大突破是认识到量化,数值格式方面有相当多的创新和减少空间,通过将 64 位浮点数拆分成 8 位,可以将 AI 超级计算机的性能提升约 8 倍,所以这几乎相当于 10 倍的提升,另外一个重要的创新是 Transformer 。


Transformer 引擎非常通用和有用,我们设计了一个专门用于学习和推断 Transformer 的流程,这两个是最重要的创新;此外,Hopper 是世界上最大的芯片,速度也是最快的,超级节能,并且使用了世界上最快的存储器,我们将许多这样的芯片连接在一起,以实现快速和高效能,这些都是一些比较直接的暴力方法。但是,最重要的架构思想是 FPA 和 Transformer 引擎。


Sarah Guo:

对于我们公司的精炼部分,你们正在研究的未来 10 年中可能重要的应用有哪些?


Jensen Huang:

我们正在进行一些目前还不可行的工作,但我对它们的成功充满信心。例如,自动驾驶仍在取得进展,但我相信它最终会成功,我相信我们能够发现一个基础的机器人模型,通过使用人类语言表达自己,可以让机器人学会如何弯曲和完成特定任务。


Sarah Guo:

那现在阻碍这些应用的因素是什么?


Jensen Huang:

我不知道,但我可以告诉你我们必须一步步地探索,但我们知道的一件事是如何从结构化和非结构化的信息中学习结构,当然下一个大的发展方向是视频,如果我们能够观看视频并从中学习结构,我们可能能够学会如何弯曲和分解,并将其推广为机器人的解构系统,路标似乎表明这些要素正在逐渐融合,但我不知道什么时候能够实现,我猜可能不到 10 年,可能大约 5 年,你会看到一些令人惊叹的机器人。


Sarah Guo: 

太令人兴奋了。


Elad Gil: 

还有一些类似的项目。最近Google推出的 PaLm 就是朝着这个方向迈出的一步,我猜那仍然是基于 Transformer 架构的,你提到了将 Transformer 流程融入你们工作的其他新的 AI 架构,你还关注其他一些新的架构,你认为它们将发展成非常有趣的东西吗?


Jensen Huang:

嗯,有很多 Transformer 的派生架构,它们通常被统称为 Transformer ,但基本架构在不断完善和发展;另一方面,我们对一些非常令人兴奋的工作也非常感兴趣,我们从 Ian Goodfellow 在生成对抗网络方面的工作开始,对图像的风格迁移和高分辨率处理进行了一些重要工作,这导致了变分自编码器等其他相关工作,进一步发展成为扩散模型的一种变体。


我们在这个过程中起到了很大的作用,在这些方面还将会有很多衍生的工作出现,但无论是从大量数据中学习结构,还是从视频或多模态学习,都将是非常重要的事情;另外一个方向是内容生成,如果你可以生成图像,生成2D 和 3D 图像,为什么不能生成蛋白质和化学物质等各种东西呢?


信念,磨难,遗忘与继续前进


Sarah Guo: 

几乎没有其他创业者经历过从 3 个创始人到 CEO ,30年,7000 亿市值的过程,你对听节目的创业者有什么建议么?(PS:如今已经接近万亿美元市值了)


Jensen Huang: 

这是一份非常艰难的工作,我不仅指 CEO 的工作,创业本身就很难,你们两位都与很多公司的成立有关,建立一家初创公司没有什么容易的,我甚至不明白为什么有人会第二次创业,创业是一种磨难,我会试图劝阻人们再次创业,因为我创办了两家公司,第二次创业时,我会问自己,你确定要这样做吗?不。毫无疑问,你不应该这样做,必须有一种遗忘的机制,就像你生孩子的时候忘记了产痛一样,必须忘记它有多么艰难,我不知道我是如何做到的,我忘记了创业的痛苦和煎熬。


一旦你取得了一些成就,你就会继续迈向下一个目标。我喜欢我们公司的一件事就是我们不断重塑自己,我们就像公司内部的创业者一样,我参加的所有会议都像创业会议一样,都很痛苦,因为你从零开始,你没有任何动力,基本上你是从 0 开始的,每一次都会让我想起它有多么痛苦,但是当你建立了一些东西,并且你为之付出努力的人们赞赏它,而且它确实产生了影响时,这也是如此令人满足,然后你将这种能力与其他技能和能力结合起来,你就可以做得更大。


所以,一方面,我会告诉他们创立一家公司是非常有回报的,你能够与很多人一起工作,这是真的;另一方面,创业的痛苦和煎熬是你无法想象的。所以,你是又脆弱的。


所以我不知道我给他们提供了什么智慧,如果你决心要做,就别等太久,在你失去无知之前去做。因此,你必须有足够的决心坚持自己的信念;另一方面,你不能固执己见,你必须具备灵活性,不断学习,在这两者的平衡中,我相信我所做的事情,同时我也相信自己可能是错的,这是一种奇怪的状态,你必须同样坚信这两者。


Sarah Guo: 

我公司的名字叫 Conviction(信念),你可以保持灵活。


Elad Gil: 

好的,我会把它作为一个糖果品牌开始(哈哈哈哈)。


Jensen Huang: 

有些创业公司的 CEO 非常有才华,他们几乎是正确的,但他们太过于执着于自己的正确性,忘记了在路上学习、调整和适应的灵活性,这是一方面;另一方面是韧性,这也与遗忘相关,你必须忘记痛苦,继续前进,就像教练说的,不要担心上一个球,你刚刚被对手踢了脸,你错过了1/4。


就像你提到加密货币时,我的手开始出汗,我知道我的心开始跳得更快,因为我记得错过了那 1 季,当我们在加密货币方面错过 1 季时,我们错过得很彻底,因为预测加密货币很困难,我们从没有供应到供应过剩。谁会错过 2 亿美元的 1 个季度?我指的是一个很大的数字,通常你会听到 CEO 错过了 1500 万美元,而不是 20 亿美元。


今天的方向来自未来

深耕科研基础模型


Elad Gil: 

我认为 Sarah 提出了一个很好的观点,你现在建立了一家在科技界具有重要地位的公司,正在推动可能是有史以来最重要的技术之一,即 AI 。从现在回顾到未来的 10 年、20年,有没有什么具体的目标,无论是通过公司还是更广泛的方向,你希望实现的?从未来的 20 年回望,有没有你真正希望实现的事情?


Jensen Huang:

这是一个很好的问题,实际上这是一种很好的思考方式,思考今天要做什么的最好方法是走到未来,回头看,你们可能也是这样做的,所以我会走出 10 年,回头看看我当时希望自己那时候能做到什么,然后现在去做,这就是答案。


所以我们相信我们可以对几个行业做出贡献,其中之一是医疗保健和药物研发,这是一个计算上和数值上极其复杂的问题,其中的组合数量超过了宇宙中的原子数量,它是一个非常庞大的问题空间,我们最终可能有必要的工具来攻克它。,少现在有能力理解氨基酸、序列、蛋白质和化学物质的语言和意义,如果你能理解结构、理解语言、理解问题空间的意义,你也许有机会解决它。


所以我对此非常兴奋,真的希望我们能够为多物理学和气候科学创造一个基础模型。这样我们就可以问一个问题,如果有这些人为因素和这些人类驱动因素,我们产生这些影响,那么 10 年后,从现在起 30 年后地球会发生什么?


这是一个非常复杂的问题。从计算上来说,人们估计这个问题的计算量可能是目前全球最快超级计算机的 10 亿倍到 1000亿倍,这基本上意味着我们永远无法解决这个问题;另一方面,通过 AI ,我们可能有机会将这个计算量减少 10 亿倍到 1000亿倍,所以我希望我们有机会在我们这一代人中为这两个领域作出巨大贡献。因此,我们正在做的是地球 2 号和 Clara,地球 2 号是我们的气候科学系统,Clara是我们的医疗保健系统,更好地了解如何在这个领域做出贡献。


👻 


Sarah Guo:

令人兴奋。我有一个最后一个问题,这个问题和攻击世界上计算量最大的、最复杂的搜索空间,从而拯救人类和地球的重要性相当.......那就是你的皮夹克从哪里来的?


Jensen Huang:

我老婆和女儿总是在帮我找皮夹克,我必须承认大多数夹克对我来说太时尚了,我穿不出去,这些是比较朴素的,但其中一些太酷了,只有真正酷的人才能穿,而且我不想显得自己穿得不搭。


Reference:

https://www.youtube.com/watch?v=ZFtW3g1dbUU&t=629s


----- End -----









您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存