查看原文
其他

智能晚报|OpenAI这项研究能让AI思考更像人;英伟达趁GPU短缺,扶持新的AI云公司;阿里云「通义听悟」启动公测...

陆彦君 新皮层NewNewThing 2023-08-02

「每天重要的新闻不会超过五条」


整理:陆彦君

编辑:王杰夫

Key Points


OpenAI这项研究能让AI思考更像人。


在GPU短缺状况下,英伟达趁机扶持新的AI云公司。


阿里云AI新产品「通义听悟」启动公测。


Google投资AI初创公司Runway。


OpenAI投入100万美元激励开发者用AI提升网络安全。


OpenAI这项研究能让AI思考更像人

ChatGPT之前一直被诟病「数学能力差」,数学家陶哲轩曾表示,GPT-4在其专业领域并没有太多增值。大语言模型在多步推理方面取得很多进展,但即使是最先进的模型仍然会产生逻辑错误。

OpenAI一直在努力训练更可靠的模型。6月1日,OpenAI最新论文研究显示,使用「过程监督」模型而非「结果监督」模型可以提高ChatGPT等AI大模型的数学推理能力。

过程监督和结果监督分别是什么?

目前有两种不同的方法来训练奖励模型:

  • 一种是结果监督模型(ORM:Outcome-supervised Reward Models),结果监督奖励模型仅使用模型思维链的最终答案完成奖励。

  • 一种是过程监督模型(PRM:Process-supervised Reward Models),过程监督奖励模型则接受思维链中每一个正确步骤的奖励。

过程监督的优势是什么?

论文中,研究人员通过奖励每一个正确的推理步骤训练模型,即以过程监督解决MATH数据集的问题,最终解决了MATH测试集中代表性子集78%的问题,因此「过程监督」显著优于「结果监督」。随着每个问题考虑的解决方案的数量增加,性能差距也逐渐增大,这也说明了过程监督奖励模型更加可靠。

(纵轴表示已解决问题的百分比,红色线是过程监督奖励模型,蓝色线是结果监督奖励模型。)图片来源:论文插图

此外,OpenAI发现「过程监督」在「对齐」(alignment)也上有很大的价值——可以训练模型产生人类认可的思维链,这意味着模型理解和回应用户输入的能力将进一步提升。OpenAI的CEO Sam Altman在Twitter上转发此研究表示祝贺,「我们的Mathgen团队在过程监督上取得了令人振奋的结果,为对齐释放了积极信号」。

为支持相关研究,OpenAI 还开源了PRM800K数据集,它是一个包含80万个人类反馈标签的完整数据集。该数据可用于探索数学以外的新领域。


参考链接

https://cdn.openai.com/improving-mathematical-reasoning-with-process-supervision/Lets_Verify_Step_by_Step.pdf


趁着GPU产能紧张,英伟达扶持新的AI云公司

AI发展热潮下,芯片公司英伟达的业绩突飞猛进。然而,其大客户——包括微软、Google和AWS在内的云计算服务商正在自研AI芯片,以减少对英伟达的依赖。

6月1日,据The information报道,英伟达会为两家云计算服务商CoreWeave和Lambda Labs提供最新的H100GPU。据悉,这两家初创公司没有自制AI芯片的打算。

英伟达这么做意味着什么?

大语言模型的研究需要强大算力支撑,现在行业内GPU严重短缺。半导体研究和咨询公司SemiAnalysis的分析师Dylan Patel指出,微软与OpenAI正消耗大量GPU用于AI推理,光是之前GPT-3的训练便已花费了1万个英伟达GPU。

OpenAI的CEO Sam Altman更是直言,目前OpenAI在GPU方面受到的限制非常严重,以致于很多新计划被迫延迟。大公司还在苦恼芯片短缺,英伟达却向两家初创企业提供最新的H100 GPU,此举无疑是在扶持新的、对自身业务没有威胁的AI云公司。

英伟达为什么要这么做?

英伟达和大客户的关系有些微妙。

为解决算力短缺问题,微软、Google等大公司都在尝试自制芯片,并采用各种方式推广。包括AWS和Google Cloud在内的主要云服务提供商正在敦促客户使用他们自己开发的芯片而不是英伟达的GPU来训练大模型。例如AWS建议一些公司在英伟达GPU短缺时,租用由AWS芯片Trainium提供支持的服务器。

这样看来,英伟达出手扶持初创公司就不难理解了。尽管目前英伟达是「AI算力王者」,一旦AI云市场被Google、AWS垄断,它们就有可能用自制芯片替代英伟达。

这些公司都在做自己的AI芯片

  • 微软:Athena、Cascade,预计2024年发布。

  • Google:Tensor(TPU),2017年发布;Maple、Cypress,预计2025年发布。

  • AWS:Graviton,2018年发布;Inferentia,2019年发布;Trainium,2022年发布。

  • Meta:MTIA,预计2025年发布。


参考链接

https://www.theinformation.com/articles/why-nvidia-aids-cloud-rivals-of-aws-

google-and-microsoft?rc=sjcmfl


阿里云AI新产品「通义听悟」启动公测

距「通义千问」发布不到两个月,6月1日阿里云又宣布了通义大模型的新进展:聚焦音视频内容的AI新产品「通义听悟」正式上线,成为国内首个开放公测的大模型应用产品。

通义听悟接入了通义千问大模型的理解与摘要能力,可完成对音视频内容的转写、检索、摘要和整理。在公测期间,用户通过每日打卡可领取100小时以上的免费转写时长。

它可以用来做什么?

  • 实时语音转文字:实时多语种语音识别,能对10人以上说话场景完成角色区分,生成会议记录,可应用于开会、上课、访谈等场景。

  • 音视频文件转文字:将录制的音视频转成文字记录,生成记录后可一键翻译。

  • 智能总结:给音视频划分章节并形成摘要、总结全文、总结发言人观点、整理关注重点和待办事项。


图片来源:产品试用截屏

它的独特性在哪里?

  • 拥有Chrome插件:安装插件后,外语学习者和听障人士可以借助双语悬浮字幕条看无字幕视频。通义听悟Chrome插件将在近期对所有用户开放下载。

  • 通义听悟与阿里云盘打通:可一键转写云盘上的音视频内容,公测期间注册的听悟用户后续将获得更大的阿里云盘存储空间,在云盘内在线播放视频时也可自动生成字幕。

  • 可嵌入各类音视频平台:钉钉的「钉闪记」便集成了听悟。未来听悟还将在夸克App、阿里云盘等端口提供服务。


参考链接

https://tingwu.aliyun.com/home


Google投资AI初创公司Runway,以期从AWS手中抢走云业务

5月31日,The Information援引知情人士消息称,Google正在投资AI初创公司Runway,后者的估值约为15亿美元。Runway的AI技术可以将文本生成为视频,并且已在电影《瞬息全宇宙》等作品中使用。不过,这轮投资却招致了Google竞争对手的批评。

Google的这笔投资为何会招致批评?

今年3月,Runway宣布与AWS建立多年战略合作伙伴关系,AWS成为其「首选云提供商」。而据知情人士透露,在与Runway的交易中,Google要求Runway选择Google Cloud作为首选云服务供应商,因此这笔投资相当于变相地「购买客户」,目的就是从AWS手中抢走云业务。

这已经不是Google第一次通过这种方法「拉新」。今年年初它就曾投资3亿美元给OpenAI的有力竞争对手Anthropic,并且在不久前Antoropic4.5亿美元的C轮融资中再次领投。当微软阵营拥有OpenAI、Google阵营拥有Anthropic和Runway,作为云服务行业的老大,亚马逊会如何应对呢?


参考链接

https://www.theinformation.com/articles/google-invests-in-ai-startup-runway-to-wrest-cloud-business-from-aws?rc=sjcmfl


OpenAI投入100万美元激励开发者用AI提升网络安全

6月1日,OpenAI在官网发布文章,公布了一项「网络安全资助计划」,将投入100万美元激励开发者用AI提升网络安全。

OpenAI的期待是什么?

在文章里,OpenAI表示,正在努力开发量化AI模型网络安全能力的方法,希望用尖端的AI技术提升防御能力,而非进攻能力。同时,OpenAI鼓励讨论,希望全面理解AI和网络安全可能面对的机遇和挑战。

OpenAI有哪些项目设想?

  • 收集和标记来自网络防御者的数据,以培训防御性网络安全代理

  • 自动化事件分类

  • 识别源代码中的安全问题

  • 协助网络或设备取证

  • 自动修补漏洞

  • 优化补丁管理流程以改进安全更新的优先级排序、调度和部署

  • 在GPU上开发或改进机密计算

    ...

OpenAI正邀请申请者提交建议,将优先考虑AI在防御性网络安全中的实际应用,且目前不会考虑资助进攻性的安全项目。资助方式表现为:从100万美元中以API积分、直接资助或提供等价物的形式每次给予1万美元的奖励。


参考链接

https://openai.com/blog/openai-cybersecurity-grant-program

-END-

新皮层New New Thing 


Hello!



我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。

和每一位关心技术、关照人的命运的读者一样,我们希望在这个有史以来不确定性最高的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的是智能,不只是AI。


请扫码关注我们吧!


若想了解更多当日资讯,请点击阅读往期智能晚报

智能晚报|Elon Musk时隔3年再度访华;小冰「克隆人」上线;Bing Chat即将支持Chrome等第三方浏览器...


喜欢就关注我们吧,记得设为星标」哦~

 

与记者交流,可添加微信(请备注公司名称和姓名):

王杰夫 微信号: wjfsty

张司钰 微信号: helianthus351

吴洋洋 微信号: qitianjiuye

 


再次,喜欢就关注我们吧,记得设为星标」


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存