查看原文
其他

红杉爱科学 | 想让AI实现自动化,还需要什么?

洪杉 红杉汇 2023-06-07

在我们设想的未来世界中,大部分的人工智能都拥有自主性,它们会及时、主动地帮助我们,而不是等待我们输入指令。而且,它们没有领域、行业的限制,也不需要我们对AI技术了解多少直接就能使用。


回到现在,相信大多数人面对AI工具,都会有一种“无从下手”的感觉——即便我们知道它“无所不能”,但是我们并不知道如何让它运作起来,来真正帮助我们的生活与工作。


不过现在,未来更近了。拥有自主性的AI工具已经出现——最近AI领域热议的AI Agents,又被称为自主人工智能、自主代理,已经能够达到自行拆解宏观任务并执行的水平。比如,你可以让自主代理帮你制定一份市场推广方案,但是并不需要你一步步告诉它怎么做。


当然,想要大规模采用自主代理,还需要在执行、算力、数据等方面突破障碍。但是仍然不能否认的是,自主代理的潜力巨大。

在过去的九个月,我们迎来了数次人工智能创新浪潮,每一次都扩展我们对AI潜力的认知。


去年夏天,能够通过文本或图像提示生成艺术作品的深度学习模型「稳定扩散」(Stable Diffusion)发布;在11月,ChatGPT又将我们的注意力转向大语言模型(LLMs);随着GPT-4和其他产品的推出,我们对LLMs的关注只增不减,这也让用于开发由语言模型驱动的应用程序的框架LangChain走进人们的视野;LangChain普及了代理(Agent),所以现在,自主代理产品也出现了——4月21日,AutoGPT上线不到一个月,在GitHub上的星星数量就突破了10万颗;另外BabyAGI获得了1.2万颗星,并激发了一长串项目。

或许你在困惑,什么是自主代理?简单来说,自主代理可以看作由语言模型驱动的机器人,它们能分解复杂问题并以迭代的方式加以解决,还能代表用户采取行动。

我们可以用一个简单的例子来说明LLMs、代理以及自主代理分别能做些什么。


仅使用LLMs,我们可以找到某个城市中最好的餐馆;使用代理,我们可以让它查找评价最高且有空位的餐厅,并预定一个两人桌;有了自主代理,我们可以让它找到最符合我的日程安排并且满足我个人喜好的最佳餐厅,同时为我和朋友预订好座位。

自主代理可以通过将一个任务分解成各个子任务,并在每个步骤之间使用记忆来指导代理的行动来实现这一点。

这样,是不是就很容易理解为什么自主代理抓住了我们的集体想象力了——它们让我们很容易去想象通过LLMs的小型轻量级应用可以来实现些什么。已经有很多人尝试过使用各种代理,从电子邮件摘要(从抓取数据到综述总结)到复杂的旅行行程规划等。

听起来,自主代理像是带着AGI(通用人工智能)的曙光而来,但说不定它也只是众多次迭代的浪潮之一。因为,目前自主代理还有很多不足之处,尚处于早期阶段,它在性能提升、用户控制和输出质量等方面还有很大的改善空间。想要实现大规模采用,代理必须至少克服三大障碍:

1.逻辑推理≠良好的执行


原则上,驱动自主代理的GPT-4等AI具有思维链推理和将任务分解为多步骤过程的能力;但在实践中,代理常常会在执行自己的子任务时遇到困难,而且它们很难知道什么时候该“退后一步”,从而导致陷入重复同样动作的死循环,或者会因为没有什么外部反馈而对某个步骤产生“幻觉”,进而卡住。

2.计算成本


这些应用程序的架构依赖于递归循环,可能导致多次重复调用你的LLMs。如今,使用像OpenAI的API等工具,每次调用的成本相对较低,但可能会遇到API限制;而对于内置模式来说,成本方程可就会大不相同了。

3.学习


由于自主代理在启动后不再重复使用,所以它们不会从提示或先前的尝试中学习,也不会从犯下的错误中吸取太多教训。不过,帮助代理存续下去的服务即将出现,这应该会简化相应的管理。

或许,未来是一个“代理对代理”交互的未来:我们可以为常见任务创建专门的代理,还可以购买预先训练好的代理步骤,将项目里的部分任务、步骤“外包”并且将这些输出作为输入整合到你的下一个步骤中。换句话说,你的人工智能可以雇佣或外包给另一个人工智能,“核心”任务可以由不同的代理来完成,而新的工具层可以作为“胶水”,将整个过程缝合起来。

要怎样才能实现这一目标?当前,我们可以依靠短期代理所使用的GPT-4 API来实现,但它的上下文窗口极其有限。所以为了发挥其全部潜力,下一代将需要做到以下几点:

• 计算意识:将资源使用量最小化作为一个目标函数。
• 数据意识:为任务找到并连接到正确的模型或数据源。
• 代理意识:寻找、重用代理的生态系统并与之沟通。
• 安全意识:检查输出和沙盒代码是第一步,此外还需要更严格的控制措施来防止滥用。
• 用户意识:从用户行为和偏好中学习以优化性能。

(文章来源:红杉美国官网)


       



推荐阅读




不要再问OKR和KPI的区别了!3张图帮助创业公司判断OKR适用性 | Human Capital Talk第十三期回顾

报名倒计时 | 对话苏凯,解码「Sparkle」

企业财务数字化如何“道”“术”结合?| 红杉中国「财书院」主题沙龙第一期实录

9点开幕!红杉全球医疗健康产业峰会直播链接戳这里!|Sequoia Health

红杉医疗投资:17年,从台下走到台上


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存