查看原文
其他

智能晚报|小红书今年盈利5亿美元;苹果测试大模型「Ferret(雪貂)」;OpenAI以1000亿美元估值寻求融资...

徐弢、杨秋秋 新皮层NewNewThing 2024-03-08

撰文:徐弢、杨秋秋

编辑:王杰夫

Key Points


苹果在研发更适合iPhone的大模型;


OpenAI计划新融资,估值目标1000亿美元;


Midjourney陷入版权风波;


特斯拉在上海又建超级工厂,不过这次是生产储能电池;


四款国产大模型通过「大模型标准符合性测试」。


苹果在研发更适合iPhone的大模型

在生成式AI席卷整个科技圈的一年里,苹果这个全球市值最高的科技公司显得格外冷静,它既没有推出聊天机器人,类似ChatGPT、Bard,也没有投资过其他大模型公司。

苹果2011年发布的Siri曾是当时最先进的语音助理。

不过,近期很多消息显示,苹果正在努力赶上进度。它不仅斥资至少5000万美元从新闻机构那里购买训练大模型所必需的高质量数据,此外它还低调开源过多模态大模型,并且还在研究如何在iPhone上运行大模型。

苹果公司计划使用新闻资料训练模型

12月22日,《纽约时报》援引信源消息称,苹果公司最近数周已经与主要新闻和出版机构展开谈判,希望在训练大模型时使用这些新闻资料。

这些新闻机构包括《纽约客》母公司出版商康泰纳仕、全国广播公司新闻(NBC News)、《人物》杂志母公司IAC等等。截至目前,苹果公司已经达成了至少5000万美元的多年期协议,但也有部分机构对于苹果公司的提案兴趣不高。

虽然苹果公司的高管近年来一直争论如何积累构建生成式人工智能所需的数据,但为了继续保持苹果会坚决保护用户隐私的企业形象,苹果在使用互联网数据训练大模型上持反对态度。既然如此,从新闻机构那里购买授权就成为主要方式之一。

同样这么做的还有OpenAI,不久前它就与Politico、Business Insider等媒体的母公司Axel Springer签署协议,付费获取后者的新闻内容,金额也高达数千万美元。在更早前的7月,它还与美联社达成过类似协议。

苹果曾发布开源大模型「雪貂」

近期,有AI研究者发现苹果曾在10月就发布过一款开源多模态大模型「雪貂(Ferret)」,但似乎因为这款模型只开源给研究机构,而非商业用途,因此当时并没有引起媒体关注。

该模型由苹果和康奈尔大学的研究团队共同研发,「雪貂」模型能够理解图像的物体,并准确地用词汇描述。例如,它能够根据图像中的三明治材料,描述制作三明治的过程。

「雪貂」模型有很好的图像理解能力。

该项目的GitHub文档资料显示,研究团队使用了8块、80GB内存的A100芯片训练该模型,基础模型是根据130亿参数的开源模型Llama微调得到的模型Vicuna。在微调「雪貂」时,研究团队使用一组与Vicuna模型相似的参数。目前,「雪貂」拥有70亿和130亿两个参数版本。

苹果想在iPhone上部署大模型

虽然已经有手机厂商将大模型能力接入到手机,例如华为手机最新助手小艺就已经拥有智能摘要等大模型才能提供的能力。小米、OPPO、vivo、三星也都有类似的计划。

但是以上这些智能助手的大模型能力还是通过云端处理器通过网络赋予的,一旦手机断网,很多能力就无法正常运作。除此以外,如果使用大模型的能力需要通过上传信息给服务器,那么就有泄露用户隐私的潜在风险。

这些缺点对于想要保护用户隐私的苹果来说,都很难接受。12月,苹果AI研发团队在电子预印本服务arXiv上刊登的一篇新论文显示,苹果正在研究如何在内存有限的设备(也就是智能手机)上部署大型语言模型。该公司的研究团队提出的两种新技术可以大幅加速本地模型的运行速度。

苹果公司追赶生成AI进展

  • 2023年7月,彭博社报道称苹果内部建立了自己的AI框架Ajax以及自己的聊天机器人AppleGPT。这两个项目都成立于2022年,Ajax基于Google云的机器学习框架Google Jax搭建,AppleGPT也类似复刻了ChatGPT等同类应用,并没有体现较突出的特色。

  • 9月,苹果的AI基础模型团队的信息得到更多披露。该团队由曾在Google Brain任职的华人学者庞若明领导,总共有16人,关键角色几乎都来自Google,团队每天的研发成本高达数百万美元。此外苹果还有一个视觉智能团队正专注于生成图像、视频和3D场景的AI,类似于Midjourney 或OpenAI的Dall·E 2。

  • 10月,彭博社报道称,苹果对于OpenAI等公司在生成式AI领域占得先机感到「非常焦虑」,目前正启动一项庞大的计划试图追赶,整体计划由苹果负责AI和软件工程的两位高级副总裁John Giannandrea和Craig Federighi领导,服务部门高级副总裁Eddy Cue也参与其中,计划的预算是每年10亿美元。

  • 2024年,苹果计划举行一次专项的AI产品的发布。


参考链接

https://www.nytimes.com/2023/12/22/technology/apple-ai-news-publishers.html


OpenAI计划新融资,估值目标1000亿美元

12月22日,有消息称OpenAI计划以1000亿美元甚至更高的估值进行融资。不过本轮融资的条款、估值和时间等细节都没有最终确定。

今年9月以来,OpenAI寻求新一轮融资的消息不断传出,估值也从800亿美元持续上涨。如果最终OpenAI真能以1000亿美元估值融资,那么它将成为美国仅次于SpaceX的第二大创业公司,后者目前估值1500亿美元。

作为对比,今年4月融资时OpenAI估值270亿美元,历史上还从未有创业公司经历过如此疯狂的估值膨胀。

OpenAI同时在为合资芯片公司筹集资金

OpenAI在推进新融资计划的同时,还与阿联酋AI公司G42就为新的芯片合资公司筹集资金进行了讨论,计划筹集80亿至100亿美元。

今年10 月,OpenAI与G42建立合作伙伴关系, G42计划在金融服务、能源、医疗保健和公共服务等领域利用 OpenAI模型产品,但双方没有提供财务细节。

今年11月,彭博社援引信源消息称,OpenAI创始人Sam Altman努力为代号「底格里斯河(Tigris)」的芯片项目筹集资金,目标是与英伟达的AI芯片竞争。为此,Altman已经与软银集团、沙特阿拉伯的主权财富机构公共投资基金(PIF)、阿联酋第三大主权财富基金穆巴达拉投资公司等就AI芯片、AI硬件项目进行了谈判,目标是寻求数百亿美元的资金。

目前,还无法确定OpenAI这轮融资与芯片合资公司筹资之间的关系。

OpenAI今年的估值变化

  • 2023年4月,OpenAI出售股份给Thrive、红杉资本、Andreessen Horowitz 和K2 Global,估值270亿美元。

  • 9月到10月,OpenAI计划由风险投资公司Thrive Capital牵头出售现有股份,估值达到800亿美元或以上。

  • 11月,OpenAI继续推进员工出售持股的计划。但10月「罢免Altman」事件后,员工选择加入股票出售计划的时间期限延长至1月5日,OpenAI目标估值860亿美元。


参考链接

https://www.bloomberg.com/news/articles/2023-12-22/openai-in-talks-to-raise-new-funding-at-100-billion-valuation

Midjourney陷入版权风波

12月21日,Midjourney发布V6 Beta版本,提高生成图像高清晰度的同时,允许用户在图像中添加文字。但有用户发现,该版本生成的图像与已有的版权照片非常相似,很多人因此质疑Midjourney正在使用版权照片训练模型。

Midjourney V6 Beta的版权风波

Midjourney V6推出后,不少用户们在X平台(原Twitter)上分享了他们的生成效果。

其中@Vitor de Lucca发现,在使用「Joaquin Phoenix(DC电影《小丑》主角),电影《小丑》,2019,电影场景」这些提示词后,Midjourney V6 Beta版本生成的图像与电影原本的场景几乎相同,只有背景颜色有所差别。

Midjourney生成的4张图片,右下角那张与电影截图极其相似。

@ProperPrompter则生成了一系列的动画电影画面,包括《龙珠》《瑞克和莫蒂》《神偷奶爸》《海底总动员》等,角色和背景与剧集相似度很高。

科技博客THE DECODER也遇到了相似的情况。该网站在使用「甘道夫举起魔杖,望向地平线,电影场景,截图,电影场景,电影镜头,--ar 16:9」作为提示词时,Midjourney生成的图像与《魔戒》电影场景极其相似。

Midjourney生成的4张甘道夫都有着神似电影演员的样貌。

此前,AIGC领域已经出现了多起版权争议。OpenAI、微软、Stability Al、DeviantArt以及Midjourney等公司都曾因侵犯版权被起诉。

原因或许是扩散模型有概率记忆已有图像

2022年12月,纽约大学和马里兰大学的研究团队发表了一篇名为《扩散艺术还是数字伪造?》的研究论文。研究团队检查了LAION-2B 20亿张图像训练数据集中的1200万张图像,结果发现,在随机测试中,平均生成100个图像,大约2个图像与数据集中的图像非常相似。其次,他们还发现,在较小数据集上训练的扩散模型,更有可能从训练数据复制或生成非常相似的图像,训练集体量增加,复制量则会减少。

今年3月,Google、DeepMind、苏黎世联邦理工学院、普林斯顿大学和加州大学伯克利分校组成研究团队,针对Stable Diffusion、Google推出的文生图模型Imagen进行了研究。该研究团队发现,Stable Diffusion生成的1.75亿张图像结果中,有103张图像与模型的训练集非常相似。他们的结论是,扩散模型的「记忆」很大程度上依赖于模型大小、训练时间和数据集大小等训练设置,研究团队根据各种图像相似度指标定义了近似「记忆」的概念。

科技博客THE DECODER认为,Midjourney V6 Beta版本可能在相同的数据集上进行了重复和集中训练,最终产生了与训练数据几乎相同的输出,也就是所谓的「过度训练」或「过度拟合」。


参考链接

https://the-decoder.com/midjourneys-v6-model-draws-close-to-copyright-infringement-with-movie-scene-images/


特斯拉在上海又建超级工厂,不过这次是生产储能电池

12月22日,特斯拉在临港新片区举行了其上海储能超级工厂项目的土地出让签约仪式,宣布了储能超级工厂这一项目正式启动。

新工厂坐落上海临港

储能超级工厂同样位于上海自贸试验区临港新片区,位置上临近上海超级工厂,即特斯拉全球最大的生产基地,该基地主要负责电动车产品的生产。该项目是特斯拉首个在美国本土以外的储能超级工厂项目,预计于2024年一季度开工,四季度投产,晚于原定今年第三季度动工,2024年第二季度投产的计划。

初期规划年产量1万组Megapack

据报道,该项目将初步规划每年生产1万组超大型商用储能电池Megapack,储能规模将达到近40 GWh,面向全球市场供应。根据高工产业研究院(GGII)调研数据,特斯拉这一项目的产量约为中国2022年储能锂电池总出货量的30.8%。

Megapack是特斯拉在2019年推出的第三代固定式储能产品,每个电池组可存储超过3兆瓦时的能量,足以满足3600户家庭一小时的用电需求。据报道显示,Megapack主要面向大型企业和公共事业单位,能够存储风能、太阳能等清洁能源电力,还可以和各国市场现行的电网进行并网,从而稳定电网、预防断电。

新工厂是为了降低生产成本

CNESA Datalink全球储能数据库数据显示,储能价格不断走低,2小时储能系统中标均价为0.8元/Wh,4小时储能系统中标均价为0.73元/Wh。而根据特斯拉官网显示,2小时Megapack产品约合人民币3.84至4.05元/Wh,4小时产品约合人民币3.55至3.66元/Wh,远高出中国国内市场价格。特斯拉在中国建设储能超级工厂将有效降低储能电池的生产成本,从而提高利润水平。特斯拉财报显示,储能业务在三季度实现营收15.6亿美元,占总收入的7%,较去年同期增长40%。


参考链接

https://finance.sina.cn/2023-12-23/detail-imzyzfys5422401.d.html?from=wap


四款国产大模型通过「大模型标准符合性测试」

12月22日,国内首个官方「大模型标准符合性评测」结果公布,四款国产大模型通过测试,符合《人工智能大规模预训练模型第2部分:评测指标与方法》的相关要求,符合国家相关标准。

「大模型标准符合性评测」是什么?

「大模型标准符合性评测」是由中国电子技术标准化研究院发起,旨在建立大模型标准符合性名录,从而推动中国AI产业有序发展。这项测评从今年8月底开始,对外征集了学术和产业的几十余家单位意见,并通过大语言模型理解、生成、逻辑等核心能力的38项具体评测维度评估大模型能力。

12月22日,全国信息技术标准化技术委员会人工智能分委会全体会议举行,并公布测评结果。全国信标委人工智能分委会成立于2020年,主要负责人工智能基础、技术、风险管理、可信赖、治理、产品及应用等人工智能领域国家标准的制订与修订工作。

四家大模型分别是谁?

「大模型标准符合性测试」结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四家大模型首批通过测试。

  • 百度文心一言:发布于3月16日,是中国市场上第一个公开发布的生成式AI产品,目前其基础模型目前已经迭代到文心大模型4.0版本。文心大模型目前调用量居国内首位,日均调用量达千万次,用户数量超过7000万。今年9月,百度获批向公众开放服务备案和深度合成服务算法备案。

  • 腾讯混元大模型:今年9月7日发布,是由腾讯全链路自研的通用大语言模型,拥有千亿参数规模和超2万亿tokens的预训练语料。今年10月,混元大模型开放「文生图」功能和从十亿到千亿不等的不同尺寸的大模型。目前,混元大模型已接入腾讯旗下B端和C端的多项业务,如腾讯会议、腾讯文档等。

  • 360智脑:发布于今年3月,为360自研千亿参数大语言模型,目前已升级到4.0版本并接入360智脑官网等多个360系应用。6月12日,360智脑通过工信部信通院认证,成为国内首个「可信AIGC大模型」。

  • 阿里云通义千问:发布于2023年4月,阿里云自称其是本次测评中唯一一个开源大模型。目前,阿里云已开源通义千问18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型。不过,阿里云在2023年10月云栖大会上发布的参数量达到千亿的通义千问2.0模型目前未开源。


参考链接:

https://mp.weixin.qq.com/s/jvxASHr00LlVZa8RGmQx9Q

https://mp.weixin.qq.com/s/o8jtn2RzBFx21vCbYAgNhQ

https://mp.weixin.qq.com/s/x5CTyoisHOIHdJ7_th5uPg

https://mp.weixin.qq.com/s/mT7SiPg96cRtwYvLQaDa4Q


Bonus

小红书再次否认上市传闻

12月25日,针对明年下半年启动香港IPO的传闻,小红书对此回应称,公司目前暂无上市计划。三天前,彭博社爆料称小红书今年预计盈利5亿美元,高于今年年初预期的5000万美元,并据此推测,在业绩增长的驱动下,小红书可能重启IPO计划。

2021年就有传闻称小红书将考虑于香港上市,并且当年聘请花旗银行前董事总经理杨若担任CFO的举动更佐证了这一传言。当年11月,小红书老股东参与了新一轮5亿美元融资,估值200亿美元,这是小红书最近一轮融资。然而,随着2022年9月CFO杨若离职,小红书被认为暂时搁置了上市计划。


参考链接:

https://www.bloomberg.com/news/articles/2023-12-22/china-s-instagram-like-xiaohongshu-on-track-for-2023-net-profit


-END-

智能晚报|淘天更换6位管理者,多位80后上任;Midjourney发布六代模型,开始会写字了;华尔街金融机构成为生成式AI大客户

智能晚报|淘天CEO换帅;抖音登记了一个AI内容生成系统;OpenAI赋予董事会模型发布否决权;苹果两款手表陷血氧检测专利纠纷

智能晚报|阿里巴巴减持小鹏;字节跳动Seed大模型使用GPT数据训练;Gemini中文语料疑似来自文心一言...


继续滑动看下一个

智能晚报|小红书今年盈利5亿美元;苹果测试大模型「Ferret(雪貂)」;OpenAI以1000亿美元估值寻求融资...

徐弢、杨秋秋 新皮层NewNewThing
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存