查看原文
其他

智能晚报|马斯克预计自家人形机器人能卖1-2亿台;苹果“个人语音”功能15分钟内克隆出你的声音...

张司钰、吴洋洋 新皮层NewNewThing 2023-08-02

「每天重要的新闻不会超过五条」


整理:张司钰、吴洋洋

编辑:王杰夫

Key Points


马斯克预计人形机器人Optimus将售出1亿至2亿台。


苹果的“个人语音”功能15分钟内克隆出你的声音。


百度智能云开始盈利,李彦宏说文心一言潜力更大。


医疗健康AI初创公司Hippocratic AI获5000万美元融资。


集度自动驾驶负责人被指控窃取苹果机密。


马斯克预计人形机器人Optimus将售出1亿至2亿台

5月17日举行的特斯拉2023年股东大会上,特斯拉CEO马斯克更新了FSD(Full Self-Driving,完全自动驾驶)和人形机器人Optimus(擎天柱)的最新进展。

擎天柱机器人有了新动态,但不多:

股东大会上展示的demo镜头中,可以看到5个擎天柱机器人原型,他们在办公室和工厂走动,并执行了一些基本任务,比如,跟人类学习一些动作。这些原型机的动作看起来稳定,但速度有些缓慢。

2022年9月底的AI DAY上,擎天柱机器人原型机首次亮相,使用与特斯拉FSD相同的软件系统。当时马斯克称,大概3到5年后,人们就可以订购擎天柱机器人,并且价格比汽车便宜很多,只需要1万到2万美元。不过这一次的股东大会上,马斯克仅仅放出了擎天柱机器人最新demo,并没有对其做任何技术上的解析。

相反,他强调了人形机器人的开发难度——远远大于自动驾驶系统。软件层面,自动驾驶车辆虽然也被视为机器人,但系统只需在横向和纵向两个维度控制运动。而人形机器人有数个关节,每个动作都涉及多个维度。

擎天柱机器人对特斯拉有多重要?

去年年初,马斯克声称,擎天柱机器人项目已成为特斯拉的首要任务。5月17日的大会上,马斯克预测市场对擎天柱机器人的需求最终将在1亿至2亿台之间,并且,特斯拉未来长期价值的大部分将来自这款人形机器人。特斯拉预计在完成其赛博皮卡(Cybertruck)生产后开始生产擎天柱机器人。

马斯克曾发推文称,Tesla AI将在通用人工智能领域中拥有一席之地,尤其擎天柱机器人出现后,因为它是在真实世界中接受训练。这不由得让人联想起上周末来自清华大学和北京师范大学的研究团队发表的一篇论文,文中称如果GPT-4有身体,将是167cm。


参考链接

https://youtu.be/XiQkeWOFwmk

https://www.biorxiv.org/content/10.1101/2023.03.20.533336v3


苹果的“个人语音”功能15分钟内克隆出你的声音

5月16日,苹果公布了即将推出的iOS 17系统的一系列新功能。这些功能主要针对残障人士,聚焦认知能力、视力、听力与肢体活动能力,其中对于生成式AI的应用是亮点。苹果为患有失语风险的用户提供了嗓音合成功能,用户只要跟着提示阅读一组设备随机给出的文本,15分钟后,苹果就能够利用这些数据训练出一个专属的嗓音模型。未来用户与其他人交流时,只要打字,苹果就能够自动将文字用这个专属的嗓音模型说出来。

具体有哪些新功能?

  • 辅助访问(Assistive Access):便于认知障碍用户独立使用iPhone与iPad;

  • 实时语音(Live Speech):失语用户可以在通话与交谈中,通过打字转换语音输出的方式对话;

  • 个人语音(Personal Voice):面临失语风险的用户可以创建与自己嗓音相似的合成语音;

  • 即点即说(Point and Speak):失明或低视力用户,可以在放大器的检测模式中通过该功能识别指向文本并大声朗读。比如,在使用微波炉等家用电器时,随着用户在电器按键区移动手指,即点即说功能可以结合相机App与激光雷达扫描仪输入的内容,辅以设备端机器学习,朗读出每个按键上的文字。

哪些功能更新了?

  • 失聪或重听用户可以让Made for iPhone助听设备直接与Mac配对,并自定义设置;

  • 用户在语音输入时可在“do”“due”和“dew”等多个发音相似的选项中选择正确的词汇,并使用语音命令替代iPhone、iPad和Mac的触控与输入;

  • 肢体与活动障碍用户可使用切换控制将任意开关变成虚拟游戏控制器;

  • 低视力用户可以调整Mac上的访达、信息、邮件、日历和备忘录等App的文字大小;

  • 对快速动画敏感的用户,可以在信息和Safari浏览器中自动暂停GIF动图等带有移动元素的图像;

  • 用户可以在0.8倍速与2倍速的范围内调整Siri语速。

什么时候更新?

关于软件更新,苹果已确认iOS 16.5将于本周向公众发布。今年4月起,苹果就一直在内部测试iOS16.6,这可能是iOS 16系统最后一次更新。第一个iOS 16.6 beta会在本周晚些时候或下周推出。iOS 17系统将在下个月苹果全球开发者大会上发布。


参考链接

https://www.apple.com.cn/newsroom/2023/05/apple-previews-live-speech-personal-voice-and-more-new-accessibility-features/


百度智能云开始盈利,李彦宏说文心一言潜力更大

5月16日,百度公布了2023年第一季度财报,营收311亿元,同比增长10%,净利润(non-GAAP)达到57亿元,同比增长48%,营收和利润均超市场预期。值得一提的是,百度智能云业务收入从上一季度同比增速转负的困境中走了出来,同比增长8%至42亿元,并且首次在非公认会计准则情况下实现盈利。CEO李彦宏在电话财报会议里表示,百度文心一言发布后引起广泛关注,在未来会成为拉动智能云业务增长的重要驱动力。

通过数据看百度文心一言

自3月发布以来,文心一言已经完成4次升级,实现了推理成本90%的下降。这主要得益于百度全栈自研的四层人工智能架构:芯片层的昆仑芯、框架层的飞桨、模型层的文心大模型和应用层的文心一言。此外,文心一言的火爆带来了大量关注度,目前已有超过300家企业参与到了文心一言内测中,包括服装、金融、政务、教育等,潜在客户数量同比增长了400%。

不过,这种盈利能否持续是个未知数。国内云计算行业正在掀起价格战。就在昨天(5月16日),腾讯云宣布对多款核心云产品降价,阿里云则从更早的5月7日开始对核心产品全线降价。


参考链接

https://finance.sina.com.cn/stock/usstock/c/2023-05-16/doc-imytyvxu9850565.shtml


医疗健康AI初创公司Hippocratic AI获5000万美元融资

5月17日,Hippocratic AI宣布获得5000万美元种子轮融资,用于为医疗健康行业完善大语言模型,扩展业务范围。

Hippocratic AI是一家怎样的公司?

Hippocratic AI成立于2022年,总部位于美国加利福尼亚州。产品方面,这家公司主要提供Patient simulator(类ChatGPT问答)和flashcard generator两种功能。

  • Patient simulator:扮演“患者”的角色,模拟心血管、呼吸、肠胃、肌肉骨骼、神经学、内分泌、肾脏、生殖等8种病人问答,以及愤怒、急躁、焦虑等情绪特征;

  • flashcard generator:提供文本切片功能,医生可以上传医学笔记,系统根据上传内容生成若干个医疗问答。

有趣的是,该公司的名字取自古希腊伯里克利时代的医师、被称为西方医学之父的希波克拉底(Hippocratic),是他将医学与巫术及哲学分离,发展为一门专业学科。

Hippocratic AI采用的技术有什么特点?

与GTP-4一样,Hippocratic AI采用的也是人类反馈强化学习(HFRL)训练方法,用于训练的数据来自专业医疗数据库,错误、歧视、非法信息的输出相对较少。在这种方法下,AI通过观察人类的行为、决策和反馈,学习如何更好地执行任务,数据标注成本较低。

总之,医疗曾被视为生成式AI最具落地前景的领域之一,但目前来看,即便是在医疗专业人员监督下训练的语言模型,仍然难以取代医护人员。其中,“安全性”问题难以解决,医疗资料内容库良莠不齐,受到有偏见的医疗记录、研究等训练出的模型并不可靠。

  • Babylon Health:这家得到英国国家卫生局支持的人工智能初创公司,因声称其疾病诊断技术比医生表现得更好而受到反复审查;

  • IBM Watson Health:因所用的训练数据不足等技术问题,导致主要客户伙伴关系恶化,2022年IBM重启出售计划。


参考链接

https://www.hippocraticai.com/


集度自动驾驶负责人被指控窃取苹果机密

5月16日,美国政府宣布对5起案件提出指控,其中一起涉及集度汽车。指控称,苹果公司原工程师王伟宝窃取了该公司自动驾驶汽车技术。

王伟宝现为集度汽车智能驾驶负责人,直接向集度汽车CEO夏一平汇报。集度汽车成立于2021年3月,由百度和吉利汽车合资,双方持股比例分别为60:40。王伟宝2018年离开苹果,2021年8月加入集度汽车。

2022年10月,集度汽车发布了限定版车型,百度创始人李彦宏预定成为001号车主。今年2月,集度在集度汽车内融合百度旗下的大语言模型(LLM)文心一言。


参考链接

http://www.ftchinese.com/story/001099678?full=y

-END-

新皮层New New Thing 


Hello!


我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。


和每一位关心技术、关照人的命运的读者一样,我们希望在这个有史以来不确定性最高的时代,更好地理解快速变化的科技世界,也更好地理解生而为“高级智能”的我们自己。在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的是智能,不只是AI。


关于往期智能晚报,请点击下面的链接:

智能晚报|达摩院自动驾驶部分并入菜鸟;OpenAI计划推出开源模型;Midjourney中文版发布内测...


喜欢就关注我们吧,记得“设为星标”哦~

 

与记者交流,可添加微信(请备注公司名称和姓名):

王杰夫 微信号: wjfsty

张司钰 微信号: helianthus351

吴洋洋 微信号: qitianjiuye

 


再次,喜欢就关注我们吧,记得“设为星标


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存