查看原文
其他

【创新周刊】AGI前夜-Weekly #62 (谷歌 I/O专题)

创新海DAO团 创新海DAO团 2023-05-14


  • 【创新周刊】AGI前夜-Weekly #62 (谷歌 I/O专题)

  • 专题:谷歌 I/O 2023 上的AI

  • PaLM 2

  • Bard变得更聪明

  • DuetAI赋能办公

  • Sidekick

  • 搜索

  • Magic Editor 和 Magic Compose

  • MusicLM (实验项目)

  • Tailwind (实验项目)

  • Universal Translator (通用翻译)

  • Project Starline

  • Codey

  • 谷歌云

  • Vertex AI

  • AI赋能的其他开发者工具

  • 谷歌刚刚发布的26个最新插件的列表

  • 申请攻略

  • 其他值得关注的创新动态

  • Resource

  • 第二大脑计划

  • 关于创新海DAO团


【创新周刊】AGI前夜-Weekly #62 (谷歌 I/O专题)

从信息海洋中精选值得关注的 AI 工具动态和教程,帮助你更好地工作和生活(WorkLife&Love)  https://agi360.xyz

专题:谷歌 I/O 2023 上的AI

在谷歌 I/O 主题日,这家搜索和互联网广告提供商在其开发者大会期间发布了一连串的公告,包括许多最近正在努力的事情的揭幕。

在这里,我们为您提供了主题演讲中宣布的重大新闻的快速点击,所有这些都在一个易于消化、易于浏览的列表中。开始了:

PaLM 2

Google 推出最新的大型语言模型 (LLM) PaLM 2。

“PaLM 2 将为谷歌更新的 Bard 聊天工具提供动力,是 OpenAI 的 ChatGPT 的竞争对手,并作为该公司宣布的大多数新人工智能功能的基础模型。”

Bard变得更聪明

谷歌不仅取消了 Bard 的候补名单,并在 180 多个国家和地区提供英语版本,而且还推出了对日语和韩语的支持,目标是在不久的将来支持 40 种语言。同样新的是 Bard 在其响应中显示图像的能力。了解更多。此外,谷歌正在与 Adobe 合作,通过 Bard 提供一些艺术生成功能。

“Bard 用户将能够通过 Firefly 生成图像,然后使用 Express 对其进行修改。在 Bard 中,用户将能够从 Express 库中的模板、字体和库存图像以及其他资产中进行选择。”

PaLM 2有四个版本,覆盖不同的运行需求。还有垂直领域版本如医疗等

DuetAI赋能办公

Google为用户推出了多功能AI辅助工具。该功能类似于微软的Copilot。

-用户可在Gmail中获得移动端写作辅助, -Google Slides中可根据文本生成图像, -文档中可自动生成招聘启事等。

这些功能涵盖了谷歌的各种办公软件,可在边栏(称为“sidekick”)中找到。

谷歌的 Workspace 套件也获得了 AI 的帮助,使其更加智能,在表格中添加了自动表格(但不是公式)生成功能,在幻灯片和会议中添加了图像创建功能。最初,自动表格比较简单,但在使用 AI 创建公式方面还有更多的事情要做。Slides 和 Meet 的新功能包括输入您正在寻找的可视化类型的能力,AI 将创建该图像。专门针对 Google Meet,这意味着自定义背景。查看更多。

Sidekick

一款名为 Sidekick 的新工具,旨在“帮助提供更好的提示,有可能取代人们应该能够在整个生成 AI 循环中做得最好的一件事。” Sidekick 面板将位于 Google 文档的侧面板中,并且“在您编写时不断参与阅读和处理整个文档,提供专门针对您所写内容的上下文建议。”

搜索

谷歌搜索有两个新功能,围绕更好地理解内容和用户在搜索结果中查看的图像的上下文。这包括更多信息,包括“关于这张图片”功能和文件本身的新标记,允许将图像标记为“AI 生成”。这两项都是已经在进行的工作的扩展,但旨在为“图像是可信的还是 AI 生成的”提供更多透明度,尽管这并不是解决 AI 图像错误信息这一更大问题的终极目标.

Google 正在试验一种由 AI 驱动的对话模式。

“用户在进行搜索时会看到建议的后续步骤,并显示要考虑的关键信息的 AI 支持快照,以及可以深入挖掘的链接。当您点击建议的下一步时,搜索会将您带到一种新的对话模式,您可以在其中向 Google 询问有关您正在探索的主题的更多信息。上下文将从一个问题转移到另一个问题。”

据谷歌称,还引入了一个新的“观点”过滤器,我们很快就会在某些搜索结果的顶部看到该结果“将从他人的经验中受益”。例如,讨论区、问答网站和社交媒体平台上的帖子,包括带有视频的帖子。

Magic Editor 和 Magic Compose

我们总是想对刚刚拍摄的照片进行一些更改,现在 Google 的 Magic Editor 功能由 AI 提供支持,可以对照片的特定部分(例如前景或背景)进行更复杂的编辑,并且可以填补空白照片甚至重新定位拍摄对象以获得更好的构图。检查一下。

还有一个名为 Magic Compose 的新功能,今天进行了演示,表明它可以与消息和对话一起使用,以不同风格重写文本。“例如,该功能可以使消息听起来更积极或更专业,或者您可以从中获得乐趣并使消息听起来像是“由您最喜欢的剧作家,又名莎士比亚所写,”。

MusicLM (实验项目)

MusicLM 是谷歌新的实验性人工智能工具,可以将文本转换为音乐。例如,如果您要举办晚宴,您只需输入“晚宴的深情爵士乐”,然后让该工具创建这首歌的多个版本。⛵️ 介绍: https://blog.google/technology/ai/musiclm-google-ai-test-kitchen/ ⛵️ waitlist: https://aitestkitchen.withgoogle.com/

Tailwind (实验项目)

Project Tailwind 是一种人工智能驱动的笔记本工具,它正在构建的目的是记录用户的自由形式的笔记并自动组织和总结它们。该工具可通过 Labs 获得,Labs 是 Google 更新后的实验产品中心。它是这样工作的:用户从 Google Drive 中选择文件,然后 Project Tailwind 创建一个具有该信息专业知识的私人 AI 模型,以及一个旨在帮助筛选笔记和文档的个性化界面。检查一下。

⛵️ https://thoughtful.sandbox.google.com/about⚠️ 目前waitlist仅开放美国IP

Universal Translator (通用翻译)

谷歌正在测试一项功能强大的新翻译服务,该服务可以将视频翻译成一种新语言,同时还可以将说话者的嘴唇与他们从未说过的话同步。

“最近才因人工智能的进步而成为可能的事物的一个例子,但同时也带来了必须从一开始就必须考虑的严重风险” 。

它是这样工作的:“实验”服务需要一个输入视频,在本例中是来自最初用英语录制的在线课程的讲座;转录演讲;翻译它;用该语言重新生成语音(匹配的风格和语气);然后编辑视频,使演讲者的嘴唇更贴近新音频。

Project Starline

谷歌推出了元宇宙产品 Project Starline 的最新原型,即其 3D全息电话会议视频亭。最大的变化包括更少的硬件,例如更少的摄像头,以及更多地依赖 AI 和 ML 来生成三维图像。更多在这里。

Codey

Google 的代码生成工具。它是许多以 AI 为中心的编码工具的一部分,也是谷歌对 GitHub 的 Copilot 的回应,Copilot 是一种用于询问有关编码问题的聊天工具。Codey 经过专门培训,可以处理与编码相关的提示,还经过培训可以处理与 Google Cloud 相关的一般查询。

谷歌云

新的A3 超级计算机虚拟机。

“这款 A3 是专门为处理这些资源匮乏的用例的大量需求而设计的”,并指出 A3“配备了 Nvidia 的 H100 GPU,并将其与专门的数据中心相结合,以获得巨大的计算能力和高吞吐量和低延迟,他们建议的价格比您通常为此类套餐支付的价格更合理。”

Vertex AI

VertexAI面向企业的AI平台,调用模型并进行微调。谷歌还宣布了新的人工智能模型托管服务 Vertex AI,这是其完全托管的人工智能服务,包括一个名为 Imagen 的文本到图像模型。Imagen 是去年 11 月通过谷歌的AI Test Kitchen应用程序预览的。它可以生成和编辑图像,以及为现有图像编写标题。

AI赋能的其他开发者工具

  • Firebase 是 Google 面向应用程序开发人员的后端即服务平台,具有一些新功能,包括添加由 Google 的 PaLM API 提供支持的 AI 扩展,以及向更多开发人员开放 Firebase 扩展市场。

  • Android Studio 正在通过 Android Studio Hedgehog 注入 AI,这是一种全新的对话体验,可帮助开发人员编写代码、修复错误并回答更常见的编码问题。

  • ML Hub 是一个新的一站式目的地,适用于希望获得有关如何训练和部署其 ML 模型的更多指导的开发人员,无论他们是处于 AI 职业生涯的早期阶段还是经验丰富的专业人士。它带有一个常见用例的工具包,谷歌打算在未来定期更新和添加。更多在这里。⛵️ http://ai.google/machinelearning

谷歌刚刚发布的26个最新插件的列表

衣食住行


插件使用场景

Adobe使用场景:Bard将能够使用Adobe Firefly生成全新的图像。

Spotify使用场景:利用你的播放列表的数据来寻找新的歌曲。或者简单地通过Bard播放你最喜欢的歌曲。

Google Shopping使用场景:为你找到最好的衣服。在比较各平台价格的同时购买你最喜欢的品牌。

OpenTable使用场景:在几秒钟内找到有预订的最好的餐厅。

Uber Eats使用场景:不想做饭?把你的饮食宏观营养给Bard,点一份符合你饮食

Walmart使用场景:通过使用Bard从Walmart下单,随时随地将任何东西寄送到任何地方。

Zillow使用场景:通过和一个房地产机器人交谈来购买你的下一套房子。找到你需要的完美的房子。

Instacart使用场景:需要最后一分钟的杂货?通过和聊天机器人谈话来选择对你最合适的杂货。

Google Travel使用场景:要去旅行?在一个地方预订你的航班、酒店等所有东西。

Google Maps使用场景:在整合你的其他计划的同时,找到最佳的旅行路线。

Trip Advisor使用场景:在一个平台上规划你的整个旅行。

KAYAK使用场景:在Bard中规划并预订你下一次旅行需要的所有东西。

工作


插件使用场景

Gmail使用场景:使用Ai写作、编辑和回复任何电子邮件。

Google Calendar使用场景:使用Bard从其他平台导入任何事件。

Google Docs使用场景:保持对所有事物的书面记录,包括研究、提示、对话等。

Google Drive使用场景:从你的Google Drive中提取数据,用于提示、研究、分析和视觉效果。

Google Lens使用场景:用Bard分析任何现实生活中的物体。同时将其与来自不同平台的其他数据结合起来。

Google Sheets使用场景:以你的方式分析和处理你的数据集。帮你创建图表、视觉效果等。

Data Commons使用场景:在你的研究/提示中分析和使用来自人口统计、经济、排放和气候的数据集。

Fiscal Note使用场景:通过汇编和分析来自多个节点的数据集,找到对你的组织的任何风险。

Redfin使用场景:在一个地方进行所有的房屋市场研究。

Replit使用场景:在50多种语言中轻松编写和运行代码。帮助你创建任何产品的速度提高10倍。

学习


插件使用场景

Wolfram使用场景:从其他平台导入你的笔记,向自己提问并学习任何科目。

Khan Academy使用场景:学习任何科目的速度提高10倍。

Zip Recruiter使用场景:让你的个人招聘者为你匹配你的理想工作。

Indeed使用场景:找不到合适的工作?将你的简历上传到Bard,找到最适合你的工作。

申请攻略

Google 的一堆产品需要在 lab 申请 waitlist,但是打开之后都提示你的账号还不支持 lab,今天终于找到问题所在。解决办法是到 Google 账户里把自动添加的简体中文语言去掉,只留英文,并把自动添加语言功能关掉(就是被它坑了)。如图。之后连上美国梯子,到这里申请吧 https://labs.withgoogle.com

其他值得关注的创新动态

  • 网红卡琳·马乔里 (Caryn Marjorie) 在她数千小时的视频中训练了一个语音聊天机器人。她开始收取每分钟 1 美元的访问费——并在第一周赚了 7.2 万美元

  • 哈佛的CS50课程节选:GPT-4是如何工作的?在这门课程中,介绍了GPT-4的基本概念和工作原理,介绍了GPT-4的基本概念、工作原理和应用前景,展示了其在各种场景下的强大能力。GPT-4作为一种生成式AI和大型语言模型,是基于神经网络和人工智能的。它可以作为文化模拟器、文本预测器、写作助手和内容生成器。https://cs50.edx.org YouTube:https://youtube.com/watch?v=vw-KWfKwvTQ&t=1799s https://twitter.com/dotey/status/1655081670234501120

  • Repo for HuaTuo (华驼), Llama-7B tuned with Chinese medical knowledge. 华驼模型仓库,基于中文医学知识的LLaMA模型指令微调⛵️ https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese

  • Meta AI 推出 ImageBind:第一个能够同时绑定来自六种模式的数据的 AI 模型。这一突破使机器更接近人类将来自许多不同感官的信息结合在一起的能力。ImageBind:Meta 最新的多模态嵌入,不仅涵盖通常的嫌疑对象(文本、图像、音频),还涵盖深度、热(红外)和 IMU 信号!OpenAI 嵌入是人工智能搜索和长期记忆的基础。ImageBind 是 Meta 的嵌入 API,用于丰富的多媒体搜索、VR 甚至机器人技术。Metaverse 将建立在向量之上。Meta ImageBind 多模态模型开源,我们离AGI又进一步。当人类看到一辆行驶中的火车,不仅会使用视觉,还会听到声音,感知距离,感知速度。⛵️ https://ai.facebook.com/blog/imagebind-six-modalities-binding-ai/

Resource

https://techcrunch.com/2023/05/10/heres-everything-google-has-announced-at-i-o-so-far/

希望我们的付出能帮工作轻松一点,多一点悠闲留给生活

第二大脑计划

第二大脑是Meta360(创新海DAO团)发起的共创计划,目标是通过整合开源AI产品和组件,结合DAO社区伙伴垂直领域知识和经验,一起构建一个,开放,透明,分布式的AGI小数据应用服务平台。在AGI时代致敬Redhat(著名的商业开源操作系统及中间件提供商)

当我思考自然语言人工智能(尤其是 GPT)的最新进展时,我对软件和人类的未来感到既兴奋又有点紧张。像我们中的许多人一样,我一直在思考人工智能将如何影响和重塑我们的工作生活。虽然人工智能有可能在未来取代工作,但我选择将其视为学习和适应的机会。—— 创新海DAO团船长

我们积极探索开放和具有稳定性和 GPT 的可用性,以负担得起的方式访问这些模型。人工智能有可能影响每个领域,影响我们生活、工作、娱乐甚至数字永生的方方面面。

欢迎加入 创新海DAO团 第二大脑计划。我们致力于构建开源透明、分布式和去中心化的 AGI产品和服务。

关于创新海DAO团

创新海DAO团(Meta360 DAO) 是一个分布式创新组织(DAO),聚集各领域的创新伙伴一起学习交流全球创新案例,提升创新能力,参与创新项目孵化,共建去中心化创新价值链,携手开辟分布式创新生态

欢迎加入创新海DAO团,共建创新价值链

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存