机器学习(Machine Learning,腾讯科技全文编译注)是计算机科学的一个子领域。计算机的性能、经验。大量的数据输入计算机,然后计算机会发现这些数据并利用这些数据进行预测和决策。有三种主要类型的机器学习模型:(1)无监督机器学习,使用算法分析无标记数据集;(2)全监督机器学习算法。(3)半监督机器学习算法,介于前两者之间。自然语言处理(NLP,Natural Language Processing,腾讯科技全文编译注)是人工智能的一个子领域。自然语言处理是计算机科学的一个子领域,其研究重点是使计算机具有与人类相似的理解文字和口语的能力。自然语言处理将计算语言学与统计、机器学习和深度学习模型相结合,使计算机能够理解文本和口语。自然语言处理将计算语言学与统计、机器学习和深度学习模型相结合,使计算机能够理解人类语言。它采用两种技术:(1)句法分析,确定句子的结构和词语之间的关系;(2)语义分析,侧重于词语的主题含义及其在句子中的上下文。谷歌翻译是自然语言处理技术在现实世界中的一个例子:Siri和Alexa等聊天机器人也依赖于自然语言处理。神经网络(Neural Networks,腾讯科技全文编译注)是机器学习的一个子领域。神经网络的每个神经元或节点接受输入,进行计算并产生输出。如果任何单个节点的输出,如果单个节点的输出高于指定的阈值,则该节点被激活,并将数据发送到下一层。最著名的神经网络之一是谷歌的搜索算法。大型语言模型(LLM,Large Language Models,腾讯科技全文编译注)是一种机器学习模型,它在大量无标注数据的基础上通过自大型语言模型使用深度神经网络生成输出。ChatGPT是最著名的大型语言模型实例。深度学习(Deep Learning,腾讯科技全文编译注)是指具有三层或更多层的神经网络。深度学习与“经典”机器学习的不同之处在于其使用的数据类型和学习方法。机器学习算法利用结构化程度较高的标注数据进行预测,而深度学习则不一定需要标注数据集,对人机交互的依赖性也较低。深度学习被广泛应用于语音识别和自动驾驶等领域。六、人工智能发展史人工智能走过的几十年:1950年代:人工智能的诞生。艾伦·图灵(Alan Turing)探索了机器智能的可能性,并开发了图灵测试(Turing Test)来测试机器表现出智能行为的能力。1960年代:对人工智能的热情不断高涨,资金不断涌入该领域,最终开发出第一款人工智能聊天机器人ELIZA。1970年代:对人工智能的热情和资金逐渐冷却,人工智能领域进入寒冬期。1980年代:机器学习的兴起使人工智能重新焕发生机。1990年代至2000年代:随着互联网大数据的出现和计算能力的提高,人工智能的创新迅速扩大。2010年代至今:随着大型科技公司开始将人工智能技术整合到其产品中,人工智能成为主流。详细列表2009年谷歌开始研发无人驾驶汽车2010年微软发布Xbox360版Kinect,首款利用三维摄像头和红外探测技术追2011年10月,苹果推出Siri语音助手。2011年,IBM的自然语言处理计算机沃森参加竞赛并获胜。2012年6月,谷歌研究人员训练由1.6万个处理器组成的大型神经网络。2012年7月,谷歌推出虚拟助手GoogleNow,即谷歌助手的前身。2014年6月,聊天机器人“EugeneGoostman“”被认为通过了图灵测试。2014年11月,亚马逊推出虚拟助手。2015年1月,埃隆·马斯克(Elon Musk)、斯蒂芬·霍金和史蒂夫·沃兹尼亚克等人在一封公开信上签名,要求禁止开发自动武器。2015年12月,非营利性研究公司OpenAI由伊隆·马斯克(Elon Musk)、山姆·奥特曼(Sam Altman)等人创办成立。2016年3月,谷歌DeepMind的AlphaGo是一款计算机程序,它能在棋盘游戏中战胜围棋冠军李世石。2016年2月,汉森机器人公司(Hanson Robotics)首次推出了一款名为索菲亚(Sophia)的仿人机器人,它能通过图像识别“看”东西,做出面部表情,并能使用人工智能进行交流。2017年6月,谷歌的研究人员发表了一篇名为“Attention is AlI You Need”的论文,即ChatGPT和DALL-E等生成式人工智能模型背后的突破性技术。2018年1月,阿里巴巴开发的Almodel在斯坦福大学的阅读和理解测试中表现优于人类。2018年5月,谷歌推出Google Duplex服务,允许人工智能助手通过电话预约。2020年2月,微软推出Turind Natural Language Generatio(T-NLG),这是一种生成式语言模型,目前是有史以来最大的语言模型。2020年6月,OpenAl发布了GPT-3语言模型,该模型通过预先训练的算法生成文本,并完成人类几乎无法完成的语言任务。2021年1月,OpenAl发布DALL--可从文本生成图像的人工智能模型。2021年5月,谷歌引入了Language Model forDialoque Applications i(LaMDA),这是一个大型语言模型,用于在对话中生成类似人类的反应。2022年8月,Stability AI发布Stable Diffusion,这是一款基于文本描述生成图像的文本到图像工具。2022年11月,OpenAl公开发布了突破性的人工智能生成工具ChatGPT,它可以基于文本输入生成长式的类似人类的反应。ChatGPT的用户数量在5天内突破100万。2023年1月,微软宣布对OpenAl进行多年期巨额投资。2023年2月,Alphabet发布了由LaMDA提供支持的生成工具Bard。2023年6月,英伟达市值突破1万亿美元。其股票在人工智能驱动的乐观情绪下大幅上涨。七、分析师——关于人工智能的讨论卡什·雷根和埃里克·谢里丹是高盛的高级证券研究分析师,分别负责美国软件和互联网行业。下面,他们将讨论最近人工智能的兴起,哪些公司和行业将从中受益,以及这对投资者意味着什么。艾利森·内森:最近出现的生成式人工智能吸引了众多关注。为什么人们对这项技术如此兴奋,尤其是人工智能已经存在了一段时间?雷根:生成式人工智能与传统人工智能主要有两点不同。首先,它能够以文本、图像、视频、音频和代码的形式生成新的内容,而传统的人工智能系统则训练计算机对人类行为、商业结果等进行预测。其二,它允许人类用自然语言与计算机交流,这在以前是从未有过的。人工智能的出现对个人和职业生产力的影响是巨大的--如果计算机能够生成高质量的内容,人们就可以将节省下来的时间用于更有价值的活动。如果计算机能够生成高质量的内容,人们就可以将节省下来的时间用于更高附加值的活动。谢里丹:人们现在非常关注人工智能,因为消费者和企业的想象力已经赶上了这项技术。Alphabet在2017年的开发者大会上首次将自己描述为一家人工智能第一的公司,而人工智能嵌入大多数日常产品(如搜索算法和推荐引擎)已有一段时间。但是,生成式人工智能工具ChatGPT已经抓住了人们的想象力,就像iPhone在智能手机已经存在的情况下推出时一样,使其能够非常迅速地扩展。这些都是“解锁”的时刻。iPhone花了几年时间才成为消费者大规模使用的设备,而ChatGPT则是我们追踪过的最快达到2亿月活跃用户的应用。因此,人工智能的解锁时刻已经到来,而且比我们过去所看到的更为激烈。艾利森·内森:对生成式人工智能的炒作是有道理的,还是被夸大了?它与之前的技术炒作有什么区别?雷根:人工智能可能没有进入炒作周期。首先,本轮技术周期并非由后起之秀主导,这使得它不太可能一蹶不振或需要很长时间才能起步。20世纪90年代初从大型机向分布式系统的转变,以及21世纪初从分布式计算向云计算的转变,都花费了比许多人预期更长的时间,因为大型老牌公司对这些转变持批评态度。IBM支持大型机系统,反对当时相对较小的甲骨文公司的分布式架构。现有的企业内部系统和技术提供商反对从分布式计算转向云计算,警告说云不安全、不经济、不能很好地扩展等。多年后,这些反对意见才被克服,云计算才站稳脚跟。只有当大型、成熟的公司开始运行云计算时,才会有一种和谐的声音告诉买家,这种技术是可以接受的。与此相反,推动人工智能技术周期的是世界上一些最强大的技术公司,它们正在建立作为生成式人工智能核心的基础模型。当技术提供商一致认为技术变革正在发生时,它就是真实的。当客户开始感兴趣时,这就不是炒作。客户对此很感兴趣。我们正在与全球企业的首席信息官进行讨论,他们对这项技术在内部部署后可能带来的生产力优势感到惊讶。而所有这一切都发生在市场奖励生产力提高的时候。因此,这并不像一个炒作周期。艾利森·内森:所以,这不是泡沫?谢里丹:虽然在泡沫破灭之前,你永远不知道自己身处泡沫之中,但在过去几个月里,绝大多数以人工智能为主题的公司的表现都优于大盘,其市盈率仍处在相对合理的倍数。泡沫通常是指企业价值与眼球/点击量、可寻址市场动态或纯粹的兴奋情绪作为估值的驱动因素,而不是市盈率。因此,这种感觉与之前的科技泡沫非常不同。艾利森·内森:即使没有过度炒作,这项技术真正对公司、工人和消费者产生影响还需要多长时间?谢里丹:在推出ChatGPT(OpenAI)和Bard(Alphabet)之后,消费互联网公司现在正进入构建阶段,他们正在构建基础模型,其中一些是针对特定业务/行业的。一旦构建完成,其中一些解决方案将需要在现实世界中部署,以了解哪些方案可行、可扩展并获得采用。从台式机到移动计算的转变是一个很好的类比。在iPhone问世四年后,Alphabet和Meta等公司才开始将自己称为移动优先的公司--这是基础设施建设所需的时间,到那时公司才可以开始谈论应用颠覆。因此,在短期内(未来6-12年)许多公司将人工智能技术视为潜在的内部生产力提升,他们正在构建、测试和学习,以了解该技术如何在更多的3年时间内增加其外部业务。雷根:目前,生产力的提高主要集中在开发人员层面。根据我们的经验,开发人员的工作效率提高了15-20%。通过自动化编写代码的一些手工和死记硬背的过程,提高开发人员的工作效率,其背后的软件起价约为10美元/开发人员/月。从成本效益的角度来看,这是难以置信的。下一批将测试这种技术的员工将是销售、市场营销和客户支持人员,他们加起来约占发达市场经济体专业员工总数的三分之一。软件公司正在准备产品,这些产品将在2024年对这些人群产生积极影响。谢里丹:我要补充的是,对消费者的影响可能需要更长的时间才能体现出来,因为通常需要多年的时间才能彻底改变根深蒂固的搜索、购物、消费等行为。尽管ChatGPT的月均活跃用户已经达到2亿,比我们追踪过的任何产品都要快,但传统搜索查询量在谷歌和必应等平台上的传播还未受到影响。因此,我们距离人工智能技术在消费者应用方面产生真正的影响还有相当长的一段时间。艾利森·内森:构建阶段听起来像是投入很多,产出很少。我们什么时候才能期待公司从人工智能生成技术中获得收益?谢里丹:构建阶段并不意味着没有人获得收入。英伟达最近发布了2024财年第二财季110亿美元的营收预期,这导致其股价大幅上涨。其他公司何时实现收益货币化的时间表因公司类型而异。对于消费互联网公司而言,货币化通常只发生在拥有一定规模的用户和购买力部署之后。应用商店就是一个很好的类比。苹果的App Store和谷歌的Play Store是计算机移动操作系统层的二元应用分发机制。雷根:对于软件公司来说,货币化可能会更快。软件公司的货币化将来自于能够引导客户购买其产品中专门具有人工智能生成功能的优质SKU。在一开始,公司可能会向客户收取较低的月费,让他们玩玩这项技术,从而降低采用门槛。一旦这些产品不断发展并变得更加复杂,企业将拥有更大的定价权。重要的是要记住,我们进入生成式人工智能只有五个月左右的时间;而云计算的前五个月看起来什么都不是。因此,货币化的能力将会增长。那些不仅拥有庞大的分销网络和客户群,而且拥有大量数据来训练大型语言模型的软件公司,在通过差异化的SKU和提高现有产品的每用户平均营收来实现人工智能收益货币化方面处于特别有利的地位,尤其是因为在分销和产品开发方面已经支付了成本结构。超大规模公司(即大规模提供计算和存储服务的大型云计算公司)也可能很快获得收入。云计算提供了大规模部署人工智能所需的计算资源和基础设施。因此,人工智能驱动的举措可能会导致企业客户增加云计算支出,而在此之前的一年里,由于对经济的担忧,大多数企业客户都优化了支出,这可能会为2023年和2024年的超大规模企业创造积极的收入轨迹。云计算超大规模企业也处于有利地位,因为它们已经花费了10年时间和数千亿美元来建设云基础设施,使生成式人工智能能够建立在坚实的云收入基础之上。因此,它们并不是从零开始;它们将利用大量已经到位的设施,在技术行业有史以来最大的投资周期之上增强人工智能生成能力。综上所述,由于资本支出增长超过收入增长,在可预见的未来,人工智能的毛利率可能为负。目前,微软、Alphabet和亚马逊的资本支出超过1000亿美元,其中很大一部分用于云计算和人工智能,而人工智能可能是增长最快的类别。但是,生成性人工智能目前对云计算行业的收入贡献微乎其微,这在大型资本支出周期的前端是很典型的。微软云计算业务的毛利率从负增长到今天的50-60%,需要10年的投资周期。这可能是人工智能的基准线。艾利森·内森:什么类型的公司最适合如何从生成式人工智能中获益?谢里丹:为生成式人工智能开发基础模型的少数大型科技公司显然处于有利地位。半导体公司和云计算领域的超大规模公司看起来也处于有利位置,可以在构建阶段获得收益。雷根:我们预计,人工智能软件的总可寻址市场将达到1500亿美元。基础设施软件公司也将从中受益。大规模运行生成式人工智能需要大量的计算能力和数据存储。当云计算出现时,一些人认为不再需要数据中心和IT员工,因为云计算可以做任何事情。但是,随着数以千计的云应用的出现,所需的基础设施急剧扩大,更不用说数据中心需要能够与云对话,这进一步增加了过程的复杂性。这就是为什么IT支出占资本支出和总收入的比例持续上升。生成式人工智能被置于现有的云架构之上,它需要能够与云应用对话,这就成倍增加了交互的复杂性和发生故障的机会。因此,提供诊断、工具、测量、反馈和稳定功能的基础架构软件公司将大有可为。在这一领域“胜出”的公司都是上市公司,其中一些甚至还不存在。艾利森·内森:是否会为新公司/小公司留出空间?雷根:当ChatGPT出现时,一些风险投资家认为它将颠覆所有公司。现在,他们普遍认为微软、Adobe、Salesforce等公司不会被颠覆,因为它们拥有大规模的工程人才和资金,以及大量的数据,可以主导基础模型层。因此,新进入者不会颠覆基础层似乎已成为共识。这并不奇怪;技术变革的历史表明,通常只有少数有规模的赢家才能获得操作系统层的绝大多数利润,人工智能很可能也是如此。 但更广泛的人工智能领域将不仅仅是巨头们的天下。应用层将为创新敞开大门。人工智能技术的用例将会被发明出来,而这些用例还没有人想到过。没有人预料到成千上万的软件即服务(SaaS)公司会从云计算中成长起来,也没有人预料到Uber会从移动优先的世界中成长起来。谢里丹:基于人工智能生成能力、颠覆医疗保健、教育、法律等行业的应用尚未诞生,但作为潜在的可能性正在被广泛讨论。在每一轮计算周期中,有趣的应用开发者都会涌现;我认为没有理由相信这一次会有所不同。如果说之前的风险投资周期给了我们什么启示的话,那就是多家新公司将尝试开发颠覆性应用,其中少数公司很可能会取得成功。艾利森·内森:人工智能监管的现状如何?谢里丹:通常情况下,监管曲线至少比创新曲线落后50年。相比之下,人工智能监管曲线几乎与创新曲线平行运行。与人工智能技术相关的潜在工作岗位转移的规模之大,以及某些灾难性结果的尾部风险,给政治家和监管者敲响了警钟,在过去十年的大部分时间里,他们在互联网数据收集、隐私和信息传播等方面也处于落后状态。这使得监管力量在此次事件中迅速发挥作用。我们报道范围内的科技公司和私人领域的公司都希望加强监管,部分原因是如果人工智能技术产生了不好的结果,他们不希望被归咎于自己,因此他们希望与监管机构合作,几乎在技术创新的同时就为这项技术设立防护栏。还有一种颇为愤世嫉俗的观点认为,大型科技公司之所以主张在技术周围设置防护栏,是因为这些公司周围形成的护城河,使小公司/新公司难以颠覆它们并在这一领域获胜。无论原因如何,监管在这一轮技术周期中比以往任何一轮都更早地成为关注焦点。艾利森·内森:监管几乎与创新同步进行,这是否会增加投资人工智能领域的风险,因为监管可能会扼杀创新?谢里丹:监管不是风险。监管通常会改变资本分配方式和行业的单位经济效益。受监管行业的利润率通常较低,但考虑到遵守监管的成本,进入门槛较高。因此,虽然投资者可能不得不接受较低的利润,但他们也不必太担心所投资的公司会被新进入者颠覆。监管肯定会减缓创新。但是,为了将不良行为者拒之门外,监管也是必要的。最终,一个充斥着不良行为者的领域,尤其是不良行为后果可能很严重的人工智能领域,对任何投资者都没有好处。艾利森·内森:那么,投资者应该注意哪些风险呢?担心什么?谢里丹:潜在的计算习惯改变是一种风险,无论它是否发生。我们已经经历了多次人们争论某件事将颠覆搜索引擎的周期。移动被认为会颠覆搜索引擎,社交媒体被认为会颠覆搜索引擎,甚至几年前亚马逊与谷歌之争也曾在投资者之间引发争论,讨论亚马逊的搜索框是否会成为搜索引擎的终结者,然而争论仍在继续。如果人工智能最终颠覆了搜索引擎,那将对现有的商业模式产生重大影响。如果消费者的行为因为人工智能而远离搜索引擎,或者搜索引擎因为人工智能而需要改变,这可能会导致与投资者所习惯的完全不同的经济结果。因此,这些都是需要关注的重大风险。雷根:我最担心的投资者风险是,人工智能生成技术变得如此普遍,以至于成为商品。如果它并不特殊,公司如何能收取溢价或实现货币化?今天,这项技术还没有普及,因为训练大型语言模型所需的专业知识非常稀缺。大型语言模型需要一定的监督,但目前很少有计算机科学家专门从事生成式人工智能研究,这限制了大型语言模型的学习速度。大型语言模型确实能够学习,因为它是仿照人脑构建的神经网络。但是,如果大型语言学习的学习速度非常快,这项技术就会得到广泛传播。到那时,这项技术可能就不再有价值了。八、人工智能对经济的潜在巨大影响约瑟夫·布里格斯(Joseph Briggs)发现,广泛采用生成式人工智能有可能大幅提高全球生产力和国内生产总值。最近出现的生成式人工智能提出了这样一个问题:我们是否正处于任务自动化快速加速的边缘,这将大大节省时间和劳动力成本,导致生产力爆发,并加快经济增长速度。尽管当前生成式人工智能模型的能力和采用时间表仍存在重大不确定性,但我们发现,在美国和其他发达国家广泛采用后,生成式人工智能有可能在10年内将年劳动生产率增长提高约1.5个百分点,并最终将全球年GDP提高7%。人工智能对劳动力市场的影响生成式人工智能对经济的最大影响可能来自其对劳动力市场的影响。为了评估这种影响的潜在规模,我们使用了美国900多种职业和欧元区2000多种职业在典型工作周内的具体工作任务数据。这些数据包含了与每个职业相关的各种任务的重要性和难度的测量值,我们结合这些数据来估算人工智能节省劳动力的自动化在总工作中所占的比例。具体来说,我们根据对生成式人工智能的可能用例的审查,选择最有可能被人工智能自动化的工作活动,并假设人工智能最终将能够完成中等难度的任务(在7点任务复杂度量表中难度等级最高为4)。然后,我们对每个职业的基本工作任务的重要性和复杂性进行加权平均,以估算人工智能可能取代的总工作量份额。我们的主要发现是,许多工人花费大量时间执行人工智能模型非常适合自动化的任务。特别是,我们估计,大约三分之二的美国职业面临至少某种程度的人工智能自动化,而在这些面临自动化的职业中,大多数职业的工作量(25-50%)都有可能被取代,尽管只是部分。在根据每个职业在美国的就业比例对职业层面的估计值进行加权后,我们估计目前四分之一的工作任务可能会被人工智能自动化,其中行政(46%)和法律(44%)职业的风险尤其高,而建筑(6%)和维修(4%)等体力密集型职业的风险较低。利用欧洲的数据,我们估计欧元区类似24%的工作任务有可能由人工智能实现自动化。尽管没有其他国家/地区的详细工作任务数据,但根据各国的行业就业份额对我们的行业级人工智能风险估计值进行重新加权后得出的结果表明,生成型人工智能最终可使全球约18%的工作实现自动化,其中发达国家的份额大于新兴市场。 生成式人工智能提高生产率人工智能产生的大量就业岗位可能会提高劳动生产率,从而显著促进全球经济增长。我们认为人工智能驱动的自动化可以通过两个渠道提高全球生产率和国内生产总值。首先,大多数工人所从事的职业会部分受到人工智能自动化的影响,在采用人工智能后,他们可能会将至少部分腾出的能力用于生产活动。这种动态在已经采用人工智能的企业中可以观察到,研究表明,采用人工智能后,劳动生产率的年增长率在数年内可提高2-3个百分点。其次,虽然人工智能技术将不可避免地取代一些工人,但我们预计,大多数被取代的工人最终将在新的职业中重新就业,这些新职业或者直接来自于人工智能的应用,或者来自于非被取代工人的生产力提升所产生的更高水平的总需求和劳动力需求。因技术变革的直接或间接影响而导致的失业工人再就业,在历史上已有很多先例。例如,信息技术在21世纪初取代了一些工人,但也直接导致了网页设计师、软件开发人员和数字营销专业人员等新职业的产生,并间接增加了医疗保健、教育和食品服务等服务行业的劳动力需求。在更长的时间跨度内,技术变革对就业的积极影响尤为明显。今天60%的工人所从事的职业在1940年是不存在的,这意味着过去80年中超过85%的就业增长可以用技术驱动的新职位创造来解释。为了估算这些渠道如何共同提高美国的生产率增长,我们结合了对非流离失所工人的生产率提升、流离失所工人的劳动力成本节约以及流离失所工人在新岗位上再就业的构成效应的估算。特别是,我们假设约有7%的工人是完全失业的。但大多数人只能在生产率略低的岗位上获得新的就业机会,部分接触人工智能的工人的生产率提升与现有研究的估计一致。为说明起见,我们假定生成式人工智能对生产率的全面提升是在10年时间内实现的(但不一定是未来10年),从很大一部分企业采用生成式人工智能时开始。根据上述假设,我们估计广泛采用生成式人工智能可使美国的整体劳动生产率年增长率提高约1.5个百分点。这种规模的增长将使美国近期的生产率增长速度翻一番,与之前出现的变革性技术(如电动马达和个人电脑)后的增长规模大致相同。生成式人工智能还可以提高美国以外的生产率增长。假设劳动力行业构成的差异可以解释人工智能对劳动生产率增长影响的大部分差异,我们估计对其他发达经济体的生产率也有类似程度的促进作用,全球广泛采用人工智能可以使我们覆盖范围内的国家的全球年生产率增长每年提高1个百分点以上(外汇加权平均值),尽管这种影响在新兴市场经济体中可能会延迟。