查看原文
其他

通用大模型如何“抢滩登陆”?慧辰马亮:高质量行业数据是垂直行业模型的关键

张悦 上海科技 2024-01-05



上海科技在近期推出

「元宇宙」系列


大模型的竞争将是一场残酷的大浪淘沙,这已成为许多业内人士的共识,而能“抢滩登陆”的关键,是快速与场景相结合。


然而,对于垂直领域来说,是否真正需要一个通用大模型?通用大模型的落地应该从哪里切入?“你再牛,你没这些行业数据,就还是做不好。”慧辰股份CTO马亮近日在接受上海科技采访时,一针见血地指出了大模型落地垂直领域的瓶颈——当大模型正在卷算法、卷算力时,对于场景落地来说,最需要的却是数据。


大模型进入垂直行业,数据是关键


在马亮看来,作为大平台服务商的大模型,随着大浪淘沙的冲刷,未来国内可能只会剩下不超过四五家,“和搜索引擎类似。”


让大模型与细分行业做结合,是大模型落地的常见模式,但马亮认为,这种结合模式并不需要足够“大”,而需要足够“专”,在细分行业中专业的小模型,或许反而能在B端脱颖而出。“现在,包括像科大讯飞等大的平台公司,都在积极寻找各种合作伙伴。”马亮透露道,许多大模型平台找到了慧辰,“因为实际上他知道我们能把模型与商业场景相结合,能落地。”


作为一家专注于数据本质的数据智能解决方案提供商,慧辰在商业场景上,已服务于汽车、通信、家电、科技、金融等多个垂直行业。“我们可以基于平台基本的开源模型,用我们积累的数据,进行训练。”马亮介绍道,“我们的模型不用大,只要数据能拿来训练,我们就能做得更好、更深入。”


相比高举高打,

轻量级专业模型优势何在?


许多细分场景与通用大模型的能力并不匹配,来自行业的专业数据可以帮助其更好地进行训练,以商业调研中的深访为例,“ChatGPT现在非常火热,大概一分钟就能读写成千上万字,但是在商业深访中却无能为力。”马亮谈道,“深访”是一种特定行业下的特别需求,而每个行业的深访内容也相差很多,动辄几十万、上百万的字数,以及非常深度的行业洞见,令目前的通用大模型“摸瞎”。


因此,在B端场景中,专业小模型优于通用大模型这样的案例十分常见,“对于B端客户来说,用AI的目的还是为了节约成本。”成本上,大模型成本十分高昂,小模型在速度上可能会比较慢,但依然是比较方便的,“五十万字的深访,用小模型,可能吃个午饭的功夫也就分析得差不多了,也是很省事的。”马亮说道。


除了成本,在马亮看来,轻量级小模型还有一个更大的优势,在于“本地部署”——“做成私有化部署放在内部,大家安心”,是许多行业头部企业的一个共识。


非本地部署的云端模型,对于许多行业较敏感的B端用户来说,有着信息安全的风险。在马亮接触过的客户中,就遇到过“绝对不会用公开的模型”的情况,甚至在某些行业,数据只要出了本地,就是违规、违法的。


通用大模型的庞大,使得本地部署将消耗大量时间与精力,因此,与行业数据深度结合的专业型小模型,恰可以填补这方面的缺位,轻量的身形也让本地部署变得方便。


大模型解决的是效率问题,

“AI创新的天花板是

该行业专家的下限”


“创新”,在各行各业都是关键词,在竞争激烈的快消领域,不断推陈出新,也是赢得竞争的关键。


大模型等人工智能工具,会带来“创新”吗?“AI创新的天花板,是这个行业的专家的下限,AI是超越不出去的。”马亮认为,作为一个生产力工具,AI带来的是效率的提升,而非真正的创新。


以快消行业的活动广告为例,过往常常要绞尽脑汁想一整天的灵感,但现在只要输入一段话,“比如需要有桃子的元素,需要体现夏天很凉爽的元素,一下子就能生成100张图。”马亮说道,“这100张候选图里,或许能挑出来几个点,并由活动策划拼出一张完美的图,一个小时就能做完了。”


“但是你仔细看,如果你让它做一幅画,要惊世骇俗、有思想性的,你一看,‘这图太有意境了’,它做不出来。”马亮说道,“就相当于在一定能力之下,AI能做得很快,但是真正牛的东西还是要靠人,所以AI解决的还是效率问题。”


因此,随着AI作为效率工具出现在商业场景中,一些较低端的工作可能面临风险,但真正的“创新”无法被取代。马亮以游戏公司为例,无论大模型如何迭代,一个好的游戏公司中,主美的地位依然无法取代,“主美画的东西AIGC就是画不出。”马亮谈道,“他对美术的认知、对游戏的理解,包括感情,是AIGC无法表现的。”


“上海科技”出品,转载请注明来源

企业及专家观点不代表官方立场


↓分享

↓点赞

↓在看

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存