查看原文
其他

​AI独角兽|③Stability AI,有关AI开源模型的生意

张司钰 新皮层NewNewThing 2024-03-08

「为什么这些公司价值10亿美元」


撰文:张司钰

编辑:王杰夫

生成式AI掀起的技术浪潮正在形成新一轮的创业潮,并催生一批估值超过10亿美元的初创公司。

这些公司创立时间短则几个月,长也仅一两年。2013年,美国风险投资家Aileen Lee提出用「独角兽」来形容这类创立不久即估值达到10亿美元的公司,意思是罕见。

然而在硅谷,在生成式AI浪潮中诞生的独角兽已不再罕见,迄今至少已有10家。我们将以系列报道的方式逐一向读者呈现这些公司,展现它们从创始团队、核心产品、商业模式到融资能力、技术壁垒以及仍然面临的挑战。无论你是创业者还是普通用户,希望这个系列的报道帮助你理解为什么是它们——而不是其他公司,刚刚创立就价值10亿美元。

我们之前报道过:AI独角兽|①Inflection:把电影《Her》变成现实
AI独角兽|②Anthropic:最可能挑战OpenAI的公司
以下是该系列的第三篇。


2022年10月17日,在Stability AI成立两年后的首次融资与产品发布会上,创始人Emad Mostaque(伊马德·莫斯塔克)选择了一个独特的暖场方式:将一张由Stable Diffusion生成的AI图片放在PPT首页,图片里的他像古典油画中的英雄那样跨坐在一匹振翅欲飞的独角兽上。那应该是Mostaque最志得意满的时刻。

Emad正在展示一张由Stable Diffusion生成的图片
2022年是AI图像生成模型爆发的一年,4月OpenAI推出DALL·E 2,5月Google推出Imagen,7月Midjourney上线。这些模型吊起了AI爱好者的胃口但又不够解渴,它们全都是闭源的,有些甚至需要等待漫长的时间,在申请被接受后才能体验。因此,当8月Stable Diffusion推出并宣布彻底开源后,这款AI图像生成模型迅速席卷了各个AI爱好者社区,人们赞扬它、拥抱它,而Stability AI作为模型「背后的公司」也得到开源社区的广泛认可。Mostaque迅速开启融资,只用了6天时间就从Coatue 和 Lightspeed 那里拿到了1 亿美元,估值10亿美元,Stability AI一跃成为这一轮生成式AI浪潮高潮到来前就诞生的为数不多的独角兽公司。

但现实残酷的地方在于:开源与赚钱常常无法兼得。更令这家独角兽公司危机重重的丑闻是:Stable Diffusion 模型并不是像这家公司创始人宣称的那样是他们开创的——创造这个文生图领域最核心模型的公司其实是Runway。



Stable Diffusion——AI开源的旗帜

3个月前,Google泄露的内部文件显示了研究员的预判——真正的赢家未必会从OpenAI与Google中产生,「开源」作为第三方力量正在崛起。开放的社区环境有助于模型快速迭代。

Mostaque善于用乌托邦式的术语定义Stability AI,并且成功将Stability AI与Stable Diffusion绑定在一起,共同成为AI开源领域的开拓者。这位年仅40岁的CEO丝毫没有掩饰自己要成为AI开源领域旗手的野心,他批评OpenAI违背了当初的开源承诺:「模型应当默认是开源的,因为价值不存在于任何专有模型或数据中,我们将构建可审计(auditable)的开源模型。」

Stability官网展示的一组由Stable Diffusion生成的图片
Stable Diffusion在发布后的一年时间里以惊人的速度迭代。一方面,模型的参数量从最初的1.5亿提升到了13亿,图像的细节变得更精细、丰富;另一方面,添加了遮罩、绘画、画面外延等辅助创作的功能后,用户可以随时修改AI生成的图像。Stable Diffusion越来越像一个好用的生产力工具。

而在新一代AI图像开源模型Stable Diffusion XL 的beta版发布仅两个月内,用户们已用其生成了超过70万张图像,有3521张被评为Discord社区的优秀作品。在7月推出的新服务Stable Doodle中,Stable Diffusion XL模型已经能够分析用户提供的草图,同时根据文本信息指导图像生成,制作logo、设计装修图纸。

更关键的是,一直以来Stable Diffusion使用一种更高效的算法(LMS采样算法),使大模型在计算资源有限的情况下得到训练,这也就解释了为什么Mostaque声称,「相比DALL·E等大模型,Stable Diffusion让用户仅使用消费级的显卡,就能够迅速实现文生图。」

Stability AI成了大家口中「看起来比OpenAI还Open的公司」。如果追溯至技术底层,现在国内许多文生图、图生图的应用中都可以见到Stable Diffusion的身影。

一位国内「AI+室内设计」领域的研发者告诉《新皮层》,目前国内应用开发的主流选择还是在Stable Diffusion的基础上做模型微调,「Stable Diffusion的体系比较成熟,技术开放性也很好,整个社区里关于它的讨论是很活跃的,而社区的力量会推动模型的迭代。因此Stable Diffusion的训练、生成的速度和质量都有很大的优势,并且在消费级显卡上也能跑起来。」



开源与赚钱不可兼得?

即便算法再优化,Stable Diffusion的训练成本仍然高昂。其第一个版本的训练耗资60万美元,这些资金来自Stability AI,但这只是冰山一角——项目前期公司的运营和云计算支出已经超过5000万美元。

为了训练包括Stable Diffusion在内的AI系统,Stability AI买了4000多块英伟达A100 GPU芯片,这是时下AI应用的主力芯片,其价格从去年12月开始上涨,相比发布时的单卡价格1万美元,短短3年里已经上升至3万美元。这意味着Stability AI未来的运营费用只高不低。

然而开源模式真的不好赚钱。一方面,开源项目所有代码都是公开的,不存在技术垄断,相比商业软件更难产生直接的利润;另一方面,用户可以自己基于开源代码搭建服务,未必非要依赖Stability AI,这也使公司锁定客户、自主定价变得艰难。

类似Midjourney这样的闭源AI图像生成产品有着简单清晰的商业化思路,用户购买AI图像生成的额度,花多少钱就生成多少张图片。然而对于开源的Stable Diffusion来说,无论模型被下载多少次,Stability AI没法从中获取一分钱。

2022年10月,Mostaque在社交平台X(前身为Twitter)上一篇对OpenAI收入估算的文章下面评论到:「Stability AI可能比OpenAI有更多的年度经常性收入(ARR)」。当时OpenAI的年收入在千万美元级别。

然而最新消息显示,2023年OpenAI的年收入将达到10亿美元;这个数字大约是Midjourney的10倍,也就是年收入大约1亿美元——这个数字又是Stability AI的10倍。据信息服务提供商Growjo统计,Stability AI目前年收入为1680 万美元,与上一年相比几乎没有增长。

目前Stability AI仅拥有DreamStudio这一个类似Midjourney的商业化项目,但产品效果、迭代速度都远不及对手。



Stability AI的商业预想图:开源模型+私有数据

在Mostaque的构想里,开源模型的商业模式就是面向企业提供解决方案,即类似红帽和MongoDB,在开源版本免费的同时,通过定制化商业版本盈利——「如果你是一家初创公司,最好的做法是找到一个将通过这一技术转型的企业,告诉他们我有一个解决方案。」在一次采访中,Mostaque如此说道。

Mostaque经常会将Stability AI与OpenAI对比,后者曾经号称要开源所有AI技术,却在GPT-4发布后选择了「闭源模型+开放数据」的路线。在Mostaque看来,Stability AI「开源模型+私有数据」的方案对于企业更具吸引力,只有更好的开源模型,才能满足企业对数据安全性的需求,即在企业原有系统内,并行构建一个搭载AI的新系统,同时将数据保存在企业内部。

一位熟悉Stability AI商业计划书的人表示,「公司更长远的计划是成为一个控股公司,支持多个开源项目的商业化」,Stability AI还在尝试拓展文生图以外的其他业务。前段时间发布的大语言模型StableLM,就像一个开源版本的GPT,目前只有30亿和70亿个参数两个版本。与之并列,基于开源大语言模型Vicuna微调后的开源聊天机器人StableVicuna也在5月推出。

「我会成立一个以基础模型作为服务的公司,今年的利润将达到1亿美元。」Mostaque多次公开提及,Stability AI正在与投资银行、资产管理公司合作,为其建立专有模型。此外,按照Mostaque所言,他已经与多个总理办公室讨论了为这些政府建立人工智能模型。

不过,越来越多的证据显示,Emad Mostaque夸大了他与技术巨头、投资银行、各国政府之间的关系。

至少4名前员工透露,在Mostaque的授意下,Stability AI在各个筹款资料上将联合国教科文组织、经合组织、世界卫生组织和世界银行等列为合作伙伴,但这些组织都对此予以否认。Mostaque还曾多次表示亚马逊云科技是其「战略合作伙伴」,但亚马逊人工智能副总裁Bratin Saha表示,亚马逊只是Stability AI的云计算服务供应商,双方的合作并无特殊之处。



Emad Mostaque——赌徒、骗子,还是理想家?

今年6月的一则报道使得Mostaque的风评急转而下。

《福布斯》在题为《Stable Diffusion的赞助者有着夸大其词的历史》一文中采访了30多位Mostaque的员工、同事、投资人与合作伙伴,称他不仅夸大了学历、成就、伙伴关系,还将Stable Diffusion的功劳揽走,并且缺乏管理创业公司的经验。

Mostaque于1983年4月出生于约旦的一个穆斯林家庭,出生一个月后他就被带到孟加拉国,7岁时又与家人移民到英国。他毕业于牛津大学,毕业后他辗转在多家对冲基金工作过,但并没有非常出色的业绩。直至2019年,Mostaque开始创业。

Emad与由Stable Diffusion生成的像素风肖像照

第一家公司Symmitree试图为穷人提供免费的智能手机和数字身份,以便他们能够使用目前无法获得的服务,如支付、汇款、健康、法律等等。但经营一年后公司就关闭了。

紧接着他就创立了Stability AI,公司最初并没有涉足人工智能领域,早期甚至考虑过在伦敦建立冷饮自动贩卖机网络,或者贩卖一些数字藏品(NFT)。不过很快他参与到联合国支持的新冠项目「以集体和增强智能应对新冠肺炎」(CAIAC)中,但仅参与过一次线上会议后,这个项目又不了了之。

然而在这个过程中,Mostaque发现了生成式AI的潜力,于是一边筹集资金与算力,一边支持开源社区的活动。2022年,他发现了Stable Diffusion这个项目。该项目最初由AI视频剪辑技术创业公司Runway与慕尼黑CompVis研究小组共同推进,中途加入的Mostaque表示可以免费提供研究所需的算力。

最终产品于2020年8月落地,Mostaque在之后的报道中将Stable Diffusion包装成由Stability AI全力支持的项目,并自封为首席传播者,这引发了Runway创始人Patrick Esser与慕尼黑CompVis研究团队领导Björn Ommer教授的不满。

从历史来看,Mostaque是一个善于发现热点,并不断调整业务重心的创业者;同时他又善于调动非商业的力量,包括社会组织、开源社区,并以攒局者的角色成功借鸡下蛋。这些因素都促成了Stable Diffusion的落地与快速发展,而Stability AI也借此成长为独角兽公司。

但更多消息也反映出Mostaque「不擅经营」。生成式AI的研发需要很强的科学前瞻性、团队组织力,以及项目管理能力,这些都是Mostaque不具备的,虽然他给予AI研究人员很大的自由度,这种去中心化的管理也会导致研发失去焦点,并且消耗过多资金。

今年6月,Stability AI宣布通过可转换债券的方式筹集了2500万美元,使其总融资额超过1.25亿美元。不过,如今的资本市场对Stability AI这家开源公司的商业前景与风险控制能力颇为迟疑。与Mostaque期望的未来几个月内将估值增加到40亿美元不同,6月这轮融资并未带来估值的增长。不久前,也一度传出公司上一轮融资已经见底,正在寻求新的投资的消息。

目前除了Stable Diffusion,Stability AI还有许多开源项目,比如通过对数百小时的现有歌曲训练生成音乐片段的Dance Diffusion。此外,生物医学模型OpenBioML、开源音频合成和处理工具Harmonai、多模态AI研究实验室DeepFloyd等的研发过程都得到了Stability AI的资助。

在Mostaque的规划里,未来通过与大公司、政府部门、投行等的合作,Stability AI将拥有全球范围内的数据资源,「各国将建立超级计算机,而我将在其上构建开源模型,我会拥有更多的超级计算资源、人才和数据,比其他任何公司都要多,并且这些都将全部开源」,当然,这是在Mostaque卖掉Stability AI之前。



公司档案:

Stability AI


创立时间:

2019年

创始人:

Emad Mostaque

核心产品:

Stable Diffusion,2022年发布的文本到图像生成式AI模型,支持通过提示词生成图像,经过多轮模型迭代,目前已支持文生图与图生图两种绘图模式。

融资历程:

· 2022年10月17日,获得1.01亿美元融资,由Coatue、光速创投领投;

· 2023年5月1日,通过发售可转换票据融资,规模不到2500万美元。

此外,2023年3月,Stability AI收购了图片编辑应用Clipdrop的开发商Init ML,并将最新的Stable Diffusion 模型及技术都集成在其网站中。

估值:

10亿美元(完成第一轮融资后),目前正寻求40亿美元估值。


-END-


若想了解更多AI独角兽公司信息,请点击阅读往期

AI独角兽|②Anthropic:最可能挑战OpenAI的公司

AI独角兽|①Inflection:把电影《Her》变成现实



我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。 

和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。

在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的智能,不只是 AI。


与记者交流,可添加微信(请备注公司名称和姓名):

王杰夫 微信号: wjfsty

张司钰 微信号: helianthus351

吴洋洋 微信号: qitianjiuye

喜欢就关注我们吧,记得设为星标」

继续滑动看下一个

​AI独角兽|③Stability AI,有关AI开源模型的生意

张司钰 新皮层NewNewThing
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存