查看原文
其他

9月综述|国产大模型刚上线,美国AIGC应用已开始商业化

王杰夫 新皮层NewNewThing 2024-03-08
「人容易高估短期变化,低估长期影响,因此回顾变得必要」
撰文 | 王杰夫
编辑 | 吴洋洋

华为与苹果的纠葛是智能领域9月的焦点。

8月29日,华为在没有召开发布会的情况下,突然在官方商城上线了最新旗舰手机Mate60 Pro。这个时间点并不寻常,因为两周后就是苹果一年一度的iPhone发布会。自2019年被美国列入出口管制的「实体清单」导致5G芯片断供以来,这是华为首次重新将自己与苹果放到同一个竞技场内。3年多里,华为手机全球出货量从巅峰的每年2.41亿部下降到2600万部,从全球第一跌到十名开外;而苹果是最大受益者之一,iPhone的出货量同期增长约2800万部。

通过对Mate60 Pro的拆解,第三方机构发现,这款手机搭载了华为自研的麒麟9000S芯片,拥有5G的网络连接性能,并且芯片采用了7nm工艺制造,而这些都曾是美国政府试图阻挠华为拥有的技术。华为Mate60 Pro的归来,意味着中国公司能够突破美国的技术封锁,打通芯片产业链的研发和生产。

影响在苹果发布会召开前就已经显现。华为新机上线后的一周,苹果股价下跌了6%。同时还有传言称,国内政府工作人员可能被禁止在工作场合使用iPhone——外交部发言人后来否认了这一传闻,但苹果股价并没有回升。而苹果发布会一切照旧,iPhone 15按部就班地用了更好的芯片、更好的材料,不过,消费者能感知到的最大更新居然只是它终于切换到了USB-C接口。该接口最早被华为手机采用,且出货量大,因此被很多国内普通消费者称作「华为口」。苹果平淡的发布会未能扭转市场的悲观情绪,瑞银证券的最新报告将苹果iPhone 15系列出货量预期从8000万至9000万部下调到了7800万部。

或许你会好奇,为何两家手机公司销量上的此消彼长可能影响到整个人工智能领域,毕竟华为与苹果在过去都不以AI研发能力见长。

原因在于,一方面,智能眼镜、手表等其他形态的个人移动终端还远远不够成熟,智能手机的统治地位在短期几乎不会改变。因此作为中美两国最先进的智能手机公司,它们生产的设备将会成为搭载AI芯片与生成式AI应用的关键载体。早在iPhone 8搭载的A11芯片上,苹果就首次加入了两个内核的神经网络引擎用于加速AI计算,而在最新的A17 Pro芯片上,神经网络引擎的内核已经增加到16个。手机芯片的AI计算能力将越来越重要,考虑到美国在禁止AI芯片出口上已有先例,华为突破技术封锁的自研芯片尤为重要。

另一方面,这两家公司也正在奋力追赶大模型的研发进度。苹果的目标是在明年推出消费级的AI助手。目前它有3个人工智能研发团队,其中基础模型研发团队每天训练模型的硬件和电费开销就高达数百万美元,此外还有视觉AI团队和多模态AI的团队。而华为在7月已经推出了盘古大模型3.0,并且基于盘古大模型构建了手机端的AI助手「小艺」。

技术公司已经成为最重要的技术投资机构。2022年,苹果的研发支出是263亿美元(约1900亿元),华为是1615亿元——还不包括这两家公司的长期资本开支,及它们带动的上下游供应链的研发支出。苹果多年来不断攀升的研发投入基于高溢价iPhone带来的巨额利润,这些利润投入到研发上又能生产更受市场认可的产品,形成良性商业循环。现在,华为准备重新进入这个良性循环。

回到大模型的竞争中,无论中外,这些公司都在9月向前迈定了一大步。


迟来一步的国产大模型

在ChatGPT上市3个季度后,8月31日凌晨,随着百度踩着零点宣布「文心一言率先向全社会全面开放」,等待数月的国产大模型终于正式上线。
与国外不同,中国对于大模型的管理是前置的。7月,国家互联网信息办公室等七部门联合审议通过的《生成式人工智能服务管理暂行办法》提到,技术公司在「利用大模型提供人工智能服务,包括以API的方式」前,需要提前备案。因此目前官宣上线的都是前两批通过备案的大模型,包括百度(文心一言)、腾讯(混元)、阿里(通义千问)、华为(盘古)、抖音(云雀)等。
当国产大模型终于脱掉「内测」的帽子,能够无障碍触及普通用户,接下来产品的成败将不限于公司具备的大模型研发能力,产品设计、运营能力等因素也将成为重点。
目前来看,各家公司在落地方式上的选择各不相同。百度主推文心一言App,毕竟百度在移动端的头部应用并不多,集中力量把文心一言培养成中国的ChatGPT似乎是个不错的策略。阿里巴巴的策略完全相反,它把大模型当作中台,将通义千问同时接入天猫、淘宝、钉钉、高德地图、天猫精灵等不同产品,充分发挥集团作战的优势。而拥有最多用户数的腾讯没有过多宣传,只是在微信上默默推出了「腾讯混元助手」小程序,这也符合这家公司一贯谨慎低调的作风。
不过且不论落地策略如何,从对用户的吸引力来看,国产大模型的表现并不尽如人意。目前,苹果中国区应用商店排行榜的前100名中,没有出现任何一款大模型产品,反观ChatGPT,它在苹果美区商店一直稳定位于前十。这背后的根本原因还是技术水平的差距,只要对比使用过ChatGPT、Claude和国产大模型,就能清晰感受到国产模型在理解能力、逻辑推理能力等各方面存在的差距。
随着越来越多大模型的出现,新技术带来的神秘感被祛魅,ChatGPT似乎也不再像当初那样遥不可及。再加上开源模型生态愈加繁荣,爱好者甚至只要花费一些时间学习网络教程,就可以照猫画虎在本地搭建一个「小模型」。只要提出问题,这个模型总能生成点内容给你。
但真正的考验才刚刚开始。当用户不再因为模型能够生成一段貌似通顺的小作文而兴奋时,想要留住用户,大模型必须更精确、更有用、更不会犯错。这最后一段距离要比之前的更加难走,也只有迈过了「能用」的门槛,抵达「好用」时,国产大模型商业化才有讨论的价值。

给大模型定价

在大模型技术的发源地美国,大模型的商业化已经铺开。
OpenAI在推出个人付费版ChatGPT 7个月后,开始将商业化触角伸入办公领域,也就是微软——这个它最慷慨的投资者与最亲密的合作伙伴——的专属领地。8月28日,企业版ChatGPT正式官宣。在拥有付费版的所有功能之外,OpenAI专门强调了数据安全的高标准要求。「企业可以本地化部署ChatGPT,这些数据都经过加密处理,只有企业本身有权利访问它,ChatGPT绝对不会用这些数据训练模型」,这些是微软的销售专家们再熟悉不过的话术。
对于企业版ChatGPT,各路媒体都在分析其潜在威胁,但微软选择以沉默应对。原因之一是,作为这个星球上向企业兜售软件经验最为丰富的公司,微软比谁都清楚这并不是一门简单的生意。这家公司在2018年就直接拥有超过4万名销售代表,还在外部建立了数十万人规模的合作伙伴生态,这么多人日复一日研究的正是如何让各行各业的公司心甘情愿地购买软件。相比之下,OpenAI整个公司的员工到今年2月仅有375人,靠谁来卖企业版ChatGPT应该是这家公司当下最迫切的问题之一。
原因之二在于,来抢生意的不止OpenAI一家,Google与它的伙伴前后脚都推出了大模型的商业化版本。8月29日,Google宣布将其AI办公助手Duet嵌入办公软件中,定价为每人每月30美元,与微软的Copilot完全一样。一周后,由Google在背后支持的创业公司、被视作OpenAI最强竞争对手的Anthropic也推出了聊天机器人Claude的付费订阅版Claude Pro,每人每月20美元,这个定价与OpenAI的ChatGPT Plus也完全一样。
除了Google这种当面锣对面鼓的较量,视频会议平台Zoom和多媒体创意软件公司Adobe也在本月推出了商业化的AI产品。前者选择将AI助手Companion纳入付费会员功能中,后者除了将AI助手Firefly纳入付费套件,还提供单独付费选项,定价每月4.99美元。
各家公司为AI助手开出了不同的价格,至少现在看来,技术公司们对于大模型的能力还是很自信的。每天0.5至1美元的价格,大约相当于几年前上班族每天早晨必买的那一份报纸。在大量关于人工智能即将颠覆某个行业的报道刊发后,大模型接受市场验证的时刻终于来了。

竞逐GPT-4

商业化的同时,硅谷技术公司们并没有停下技术迭代,下一个技术节点——多模态大模型已在多家公司的开发列表上。多模态指的是大模型不再像今天这样局限于文本内容的输入与输出,而是同时可以输出文本、图像、音频等多种形态的内容。例如用户可以让大模型读取一张地图,然后协助规划路线。
9月15日,有媒体称Google已经向小部分公司开放了其多模态模型「Gemini」(双子星)的早期版本。其实早在3月推出GPT-4时,OpenAI就演示过一个多模态的版本,但至今依然没有正式推出,有传言称,OpenAI担心这个模型因能力过于强大被用来破解验证码或人脸识别系统。
但面对想要弯道超车的Google,OpenAI必须有所作为。就在Gemini内测消息爆出的隔天,有消息称,OpenAI正准备推出拥有图像理解能力的模型GPT-Vision应对挑战,而且这个模型可能结合OpenAI另一款正在研发中的图像生成模型DALL·E 3。除此以外,OpenAI还在考虑从头搭建一款叫作Gobi的新多模态模型,这可能会成为GPT-5。但这可能还只是一个想法,毕竟OpenAI CEO Altman曾表示暂时不会开发GPT-5。不过也有人并不相信这一点,Inflection的CEO Suleyman就猜测,OpenAI已经在秘密训练GPT-5。
OpenAI的优势地位正在遭受挑战,这个已经完成100多亿美元融资的AI独角兽必须要始终保持领先,这是支撑其估值的唯一办法。但在开源生态与传统AI巨头的夹击下,OpenAI手上的牌看起来已经不多了。

以下是2023年9月人工智能领域在模型、芯片方面值得关注的进展。


国产模型篇

01. 首批国产大模型纷纷上线

8月31日凌晨,随着百度第一个踩着零点宣布其「文心一言率先向全社会全面开放」后,智谱、百川智能、商汤等公司或机构都相继宣布其大模型已经“通过备案”,数量也从媒体最开始统计的5家,上升到最终的10家。
这11家包括位于北京的百度(文心一言)、抖音(云雀)、百川智能(百川大模型)、智谱(智谱清言)以及中科院(紫东太初);位于上海的商汤(日日新大模型)、上海人工智能实验室(书生大模型)和MiniMax(ABAB大模型);位于广东的华为(盘古大模型);以及安徽的科大讯飞(星火大模型)。
通过备案后,相较于此前比较保守的内测等方式,大模型应用推广速度加快,我们将看到更多面向个人消费者的大模型产品。此后,产品的成败将不只限于公司具备的大模型研发能力,产品设计、运营能力等因素也成为重点。

02. 阿里巴巴通义大模型正式上线,新任CEO提出「AI驱动」战略

9月13日,阿里云宣布通义千问大模型已通过备案并向公众开放,用户可登录通义千问官网体验,企业用户也能通过阿里云调用通义千问API,从而训练自己的大模型。同日,阿里巴巴集团新任CEO吴泳铭发布全员信,确认未来发展的两个方向是:用户为先、AI驱动,并加大投入技术驱动的互联网平台业务、AI驱动的科技业务、全球化的商业网络。吴泳铭称:「如果跟不上AI时代的变迁,一定会有新的物种将我们取代」。

03. 腾讯混元大模型正式上线

9月15日,腾讯宣布旗下的腾讯混元大模型已通过备案,将正式上线,并陆续面向公众开放。腾讯于9月7日的全球数字生态大会上发布了该大模型,并称已将其接入腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品展开测试。此前一天,9月6日,微信已在小程序中上架和测试类ChatGPT产品「腾讯混元助手」。


海外模型篇

01. OpenAI发布ChatGPT企业版

8月28日,OpenAI在官网宣布,推出ChatGPT企业版(ChatGPT Enterprise),与ChatGPT和ChatGPT Plus并行。这是OpenAI推出的第一个企业端产品。Canva、雅诗兰黛、普华永道、Zapier等公司都已是ChatGPT企业版的早期用户。
ChatGPT企业版提供了非常强大的定制化功能。例如用户能无限次数使用GPT-4,执行速度是普通版本的两倍,还可与他人共享聊天模板,与公司员工协作构建工作流程。企业版还针对特定角色(比如数据分析师、营销人员、客户支持等职位)做了定向优化,使其更符合特定商业场景。ChatGPT企业版也支持大规模部署与数据本地化,企业可以在后台批量管理用户,还可以完全控制其中的数据,所有的数据都会经过加密处理,OpenAI不会将数据收集起来训练模型。

02. 效仿微软,Google的AI助手定价也是30美元/月

8月29日,Google在旧金山举办Google Cloud Next 2023大会上宣布,已经将AI助手Duet嵌入办公套件Google Workspace,并计划向大型公司使用该技术的用户收取费用,每人每月30美元。这个定价与微软的Copilot完全一样。
Duet AI是Google今年5月发布的生成式AI,定位是用户的办公助手,对标微软的Copilot。例如,在Gmail和Google Docs中,用户输入文本需求,Duet即可生成结果。在Google幻灯片中,用户输入描述性文本,Duet就可以据此创建图像。此外,Duet还可以在Google Sheets中制定项目计划,并为无法参加视频会议的用户自动完成会议纪要。

03. Anthropic旗下聊天机器人Claude 2增加付费订阅服务

9月7日,估值超过40亿美元的人工智能公司Anthropic推出了聊天机器人Claude 2的付费订阅服务Claude Pro,覆盖美国和英国市场。美国市场定价每月20美元,英国市场定价每月18英镑(约合22美元)。
Claude Pro的定价与ChatGPT Plus订阅服务相同。支付这笔费用后,用户可以获得比免费版Claude 2多5倍的使用量、高峰时段优先访问的权利,以及提前体验新功能的资格。Anthropic于今年7月推出了新版聊天机器人Claude 2,与前代产品Claude 1.3相比,Claude 2在数学、编程、推理技能等方面的表现都更好。

04. 苹果加速研发独家“ChatGPT”以追赶其他技术巨头

9月初媒体报道称,苹果公司正在努力构建独家大模型,每日开销达百万美元。据悉,苹果目前拥有一个有16人的基础模型(Foundational Models)研发团队。该团队由庞若鸣领导,关键角色几乎都来自于Google,庞若鸣本人之前也在Google Brain任职。庞若鸣团队的职能类似于Google和Meta的AI实验室——研究人员负责开发基础AI模型,其他部门负责把模型应用到产品中。由于训练大模型对算力要求极高,因此需要大量的硬件支持,该团队每天的硬件和电费开销达数百万美元。此外,苹果还拥有另外两个人工智能团队。其中视觉智能团队专注于生成图像、视频和3D场景的AI,类似于Midjourney或OpenAI的Dall·E 2,而另一个团队正在研究可以识别和生成图像、视频和文本的多模态AI。

05. Meta计划2024年推出新的AI模型,对标GPT-4

9月10日有媒体报道称,Meta计划在2024年年初开始训练新的AI模型,对标OpenAI的GPT-4。Meta现有最先进的大模型是Llama 2,其最强版本有700亿个参数,OpenAI未透露过GPT-4的参数,但估计模型大小是Llama 2的20倍——参数达1.5万亿个。Meta计划在2024年年初开始训练的新模型或将扩大参数,从而使模型得到更多数据的训练,变得更大。不过,也有一些AI专家认为,不必达到一样的规模,大模型也可能有其他办法实现GPT-4的功能。
此外,Meta也在构建自己的数据中心。知情人士称,Llama 2是Meta在微软的云计算平台Azure上布局的,但接下来Meta准备在自己建设的基础设施上训练新模型。因此,Meta一直在购买用于训练AI模型的英伟达H100芯片,用以建设自己的数据中心。

06. Google开始测试对标GPT-4的多模态模型「Gemini」

9月15日,Google被爆料已经向小部分公司开放了其多模态模型「Gemini」(双子星)的早期版本。「Gemini」是Google对标GPT-4开发的多模态模型,最早在今年5月召开的Google全球开发者大会上宣布。当时,Google发布了其第二代大语言模型PaLM 2,对标GPT-3.5。与大语言模型PaLM 2相同,Gemini也将提供多种规格和功能。信源消息称,Google向开发者提供的是相对较大的Gemini版本,但不是正在开发的最大版本,后者将更接近GPT-4。正在测试的Gemini提供了包括聊天机器人、代码编写工具,还能根据用户需求生成图像等。


芯片篇

01. 华为Mate60 Pro上线,搭载5G芯片突破美国封锁

8月29日,华为最新旗舰机型Mate60 Pro突然在华为商城上线。第三方机构拆机后发现,该手机搭载了华为自研的麒麟9000S芯片,并且采用了7nm先进工艺制造。这是华为自2019年下半年遭到美国5G禁令打压后,再度推出5G芯片手机。
同时有消息称,华为已在布局芯片制造。这几年,华为受到美国从EDA设计工具到Arm芯片架构、芯片生产和Google全套软件的多项限制,其中对华为影响最大的是芯片生产环节。涉及到5nm至7nm的高端制程,此前只有台积电这样的厂商能为华为代工。不过美国半导体行业协会(SIA)称,华为正在中国构建自己的芯片制造网络,它已收购两家中国半导体制造工厂,分别位于青岛和泉州;同时,它也在深圳自建了3家新工厂。

02. 阿斯麦获得许可,仍可在2023年对华出售光刻机,但明年未必

9月1日,荷兰政府发布的《先进半导体制造设备法规》生效。该法规要求阿斯麦(ASML)在对华出售其最先进的DUV设备前,必须获得荷兰当局的许可。这部分设备主要指的是型号为TWINSCAN NXT:2000i及后续推出的浸入式深紫外光刻机(DUV),不包括那种制造14nm制程中低端芯片的主流DUV设备。该法规生效当日,有媒体报道称,阿斯麦向荷兰政府申请的许可证获批。这意味着它2023年接下来的几个月它仍然可以对华出售不那么先进的DUV,但明年就未必了。在新规定生效之前,中国芯片制造商一直在争相收购重要设备。海关数据显示,截至目前今年中国从荷兰进口的此类设备已经超过了2022年全年的总量。

03. 苹果推出首款使用3nm芯片的手机

北京时间9月13日凌晨,苹果在其硅谷总部发布了新款手机iPhone 15和新款Apple Watch。其中,iPhone 15的Pro系列(即15 Pro和15 Pro Max)首次使用了第一次亮相的A17 Pro芯片,采用3nm工艺。这是目前全球制程最先进的芯片,它进一步拉开了华为手机与iPhone的差距。目前,华为能量产的最先进芯片被测量为7nm制程。从7nm到5nm、3nm的芯片都能够支持5G应用,这种制程差距对于手机的性能并不会产生多大影响,不过,更高精工艺的芯片对于Vision Pro这样的多模态硬件和生成式AI可能就是必要的。
-END-

我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。

和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。

在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的智能,不只是 AI。

若想了解更多月度综述资讯,请点击阅读往期:

八月综述 | 当开源模型成为Game Changer

与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye

再次,喜欢就关注我们吧,记得「设为星标

继续滑动看下一个

9月综述|国产大模型刚上线,美国AIGC应用已开始商业化

王杰夫 新皮层NewNewThing
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存