查看原文
其他

使用人工智能来增强The Graph网络

The Graph GraphProtocol中文 2023-04-17
                              

原文作者:Sam Green           

翻译:The Graph 社区成员                            


                                               


                                                                                                                                                                      

这篇博文是由The Graph的核心开发者Semiotic Labs(https://semiotic.ai/)的Sam Green和Tomasz Kornuta带来的。


2021年12月,Semiotic成为The Graph的第四个核心开发者团队(https://thegraph.com/blog/semiotic/)。虽然我们的章程是专注于利用研究为The Graph带来新的人工智能(AI)和密码学能力,但当涉及到对协议的贡献时,我们也有一个应用和影响导向的心态。我们通过在The Graph网络上运营一个索引人来做到这一点,这需要专门的DevOps技能,而且我们从2021年初开始运营一个有竞争力的索引人,即semiotic-indexer.eth(https://thegraph.com/explorer/profile/0xd75c4dbcb215a6cf9097cfbcc70aab2596b96a9c?view=Indexing&chain=mainnet)。此外,我们还利用我们的AI专业知识,向The Graph生态系统发布了两个自动化软件工具:AutoAgora和Allocation Optimizer。


这篇文章概述了我们过去和当前的人工智能工作,并概述了未来如何利用The Graph独特的数据索引功能进行人工智能应用的想法。


为什么The Graph非常适合人工智能


The Graph是一个去中心化的协议,用于索引区块链数据,并使其可用于下游应用的查询,如Dapp前端、绘图、仪表盘或数据分析。The Graph中有许多人工智能的用例。到目前为止,The Graph的主要人工智能用例是部署自动决策的工具。一个新兴的人工智能用例是降低访问The Graph索引的丰富网络数据的门槛。我们将主要关注前一个用例--在The Graph中使用人工智能进行自动化。


The Graph,以及一般的去中心化协议,使用激励机制来鼓励协议参与者以最佳方式诚实地行事。激励机制是对理想行为的奖励--它是行为经济学的一个概念。例如,在The Graph中,消费者通过向索引人支付GRT来激励他们为查询服务。索引人、策展人、委托人也有类似的机制,他们都有特殊的激励机制来指导他们的行为。(https://thegraph.com/blog/the-graph-network-in-depth-part-1/)


构建去中心化协议的一个含义是,决策权从一个中心化的实体(如公司)转移到协议的参与者。在The Graph的背景下,去中心化的结果是参与者需要做出许多复杂的决定。Semiotic Labs使用人工智能和相关技术来部署工具,以简化协议参与者的决策过程。我们已经为两个人工智能相关工具的开发做出了贡献:AutoAgora和Allocation Optimizer。这两个工具都帮助索引人提高他们的协议性能和收入。


AutoAgora


在核心部分,The Graph的目的是为其用户提供查询服务。在一个简化的场景中,该协议涉及多个索引人(数据卖家)、消费者(数据买家)和网关。当客户向几个网关之一发送查询时,网关根据各种因素在索引人之间分配查询,如索引人的出价、服务质量(QoS)、延迟等。索引人通过服务查询赚钱,同时自由控制他们所服务的查询的价格。这个过程描述如下:



索引人以一种叫做Agora的特定领域语言定义的模型形式来表达他们对各种GraphQL查询的出价。Agora价格模型将查询映射到GRT中的价格,即提供一个具体的价格,说明一个给定的索引人会执行多少查询。然而,为每个子图创建和更新Agora模型可能是一项繁琐而耗时的任务,因此许多索引人使用静态的、扁平的定价模型来代替。


为了帮助索引人进行定价,并确保他们遵循市场价格进行查询,Semiotic实验室创建了一个开源工具,称为AutoAgora。AutoAgora将创建和更新Agora价格模型的过程自动化,使索引人更容易提供动态定价,以反映为特定查询形状服务的实际成本。简而言之,AutoAgora是一个有用的工具,可以帮助索引人为其在The Graph网络上的查询服务提供更具竞争力和灵活性的定价。



如上所述,AutoAgora由几个模块组成,它们共同作用于创建和更新Agora价格模型的自动化过程。这些模块包括:

  • 日志处理:解析日志,以提取传入的查询、其形状和执行时间;

  • 相对成本发现:对类似的查询形状进行分组,并计算其资源使用统计(如平均执行时间);

  • 绝对价格发现:根据过去的查询量来调整价格,试图使收入最大化。


我们在绝对价格发现模块中使用人工智能,上图中的红框表示。这个模块实现了一个gaussian bandit,即一种用于强化学习的可训练随机代理。在定价查询的背景下,代理的政策被表示为对可能的查询价格的高斯分布,代理采取的行动是从这个政策分布中取样。一旦取样,价格被用来更新Agora模型,随后被发送到几个网关中的一个。从所有的技术复杂性中抽象出来(并简化了很多),bandit用来更新其政策的逻辑可以描述如下:如果运行AutoAgora的索引人服务量很大,那么价格应该增加,如果没有查询服务,那么显然价格太高。


关于AutoAgora的更多一般信息,请参考我们描述基础设施细节的博文(https://semiotic.ai/articles/automated-query-pricing-on-the-graph/)或我们在2022年6月Graph Hack的演讲(https://www.youtube.com/watch?v=DrdkX8FibHI)。关于强化学习和gaussian bandit的更多详细信息可以在我们在arxiv上的黄皮书和我们在2022年10月DevCon VI上的演讲中找到。(https://arxiv.org/abs/2212.07942)


分配优化器


目前有超过750个子图部署在The Graph Network中。在消费者可以进行子图查询之前,索引人必须 "同步 "与子图相关的区块链数据,然后将GRT分配给子图。同步子图然后提供查询服务是一项非常耗费资源的任务,所以索引人通常不会同步所有子图。在实践中,The Graph网络看起来就像下面的插图,索引人只分配给许多可能的子图中的一部分:



索引人如何知道他们应该分配到哪个子图?这就是策展人的作用。策展人在子图上发出信号(暂时存放)GRT。如果某个子图上的查询费用增加,策展人自己也会得到奖励,所以理性的策展人会尝试在查询费用高的子图上发出信号。相应地,协议的经济性也会将索引认推向高查询费用的子图,从而使他们为这些查询提供服务。通过跟踪信号,索引人最终会在有查询费的子图上。然而,分配问题并不那么容易。如果所有的索引人都只对信号最高的子图进行索引,那么它就无法工作。如果是这样的话,其他的子图就不会被服务。结果是,索引奖励奖励索引人在具有高信号的子图上,但也惩罚他们在已经被其他索引者分配了大量股权的子图上。为了弄清哪些子图需要索引,索引人必须遵循索引奖励,而不是信号。


对于许多索引人来说,跟踪索引奖励是不难的。事实上,整个问题被证明是对一个子模函数的优化,这在学术文献中仍然不是一个已解决的问题。分配优化器是一个用于索引人的开源工具,它至少可以达到部分目的。该工具将当前的策展状态、其他索引人的现有分配、特定索引人可用的GRT数量和气体成本作为输入。然后,该工具代表索引人解决一个优化问题。分配优化器的输出是对索引人的建议。该建议包括哪些子图应该被分配到,以及分配的数量。


分配优化是一个困难的数学问题,但解决数学问题本身并不能改善协议。通过为索引人提供一个可以计算其最佳分配的工具,我们可以增加他们的索引奖励收入,并释放他们的一些时间,以便他们可以专注于为子图查询提供高质量的服务。


人工智能和The Graph的未来


在这篇文章中,我们重点介绍了目前部署在The Graph网络中的AI相关工具。但The Graph还能如何利用人工智能?从另一个角度来看,人工智能建设者如何利用The Graph?


ChatGPT的发布是人工智能的iPhone时刻--它是一个使人工智能的使用民主化的工具。ChatGPT是一个品牌名称,一般被称为大型语言模型(LLM)。LLMs在总结和综合文本数据方面非常强大。它们也可用于处理数字数据,但让LLM正确地进行数学运算仍是一个新兴的研究领域。我们已经开始了一个试点项目,使用LLMs来访问和总结The Graph的大量信息。具体来说,我们将使任何对web3数据感兴趣的人能够用自然语言直观地访问它。请继续关注更多细节。


AI建设者如何利用The Graph?一种方法是使用The Graph的数据来训练新的AI模型。你可能听说过,训练神经网络需要大量的数据,而这正是我们在The Graph中所拥有的。此外,如果你有计算机科学背景,你可能听说过 "garbage in, garbage out",这是指坏的输入应该被期望提供坏的输出。ChatGPT、GPT-4和其他LLM都有 "garbage in, garbage out "的问题,因为它们是在互联网的许多公共(因此是虚假或矛盾的)数据上训练的。这也是ChatGPT经常出错的原因之一。The Graph的数据的超级优势之一是它是可验证的,这意味着它是准确的。所以我们有很多准确的数据,可以用来训练更值得信赖的AI系统。


用人工智能增强The Graph网络的能力


虽然该协议在数据索引方面比人工智能更广为人知,但The Graph确实有许多有效利用其堆栈中的人工智能所需的属性。对于索引人来说,Semiotic实验室已经创建了开源的人工智能工具,以实现复杂决策的自动化,从而提高协议的效率和索引者的收入。对于The Graph的用户来说,我们已经启动了一个试点项目,让用户通过自然语言查询访问The Graph的丰富数据。而且,在未来,The Graph可以成为训练新的人工智能模型的可信、可验证的数据来源。如果你想听到更多关于这些主题的内容,请收听GRTiQ播客的 "AI and Crypto "特别节目,我们将更深入地讨论这些(和其他人工智能相关的主题!)。(https://youtube.com/watch?v=7RZU7wbFKwQ&feature=shares)


关于The Graph


The Graph是web3的索引和查询层。开发者建立并发布开放的API,称为子图,应用程序可以使用GraphQL进行查询。The Graph目前支持超过39个不同网络的索引数据,包括以太坊、NEAR、Arbitrum、Optimism、Polygon、Avalanche、Celo、Fantom、Moonbeam、IPFS、Cosmos Hub和PoA,更多网络即将推出。到目前为止,已有74,000多个子图被部署在托管服务上。数以万计的开发者将The Graph用于Uniswap、Synthetix、KnownOrigin、Art Blocks、Gnosis、Balancer、Livepeer、DAOstack、Audius、Decentraland等应用。


The Graph网络为开发者提供的自助服务体验于2021年7月推出;从那时起,超过500个子图已经迁移到网络上,迄今有180多个索引人为子图查询提供服务,9300多个委托人和2400多个策展人。到目前为止,已经有超过400万个GRT信号,每个子图平均有15000个 GRT。


如果你是一个构建应用程序或web3应用程序的开发人员,你可以使用子图来索引和查询区块链的数据。The Graph允许应用程序在UI中有效和高性能地呈现数据,并允许其他开发人员也使用你的子图。你可以使用新推出的Subgraph Studio将子图部署到网络中,或者查询Graph Explorer中的现有子图。


The Graph基金会负责监督The Graph网络。The Graph Foundation由技术委员会负责监督。Edge & Node、StreamingFast、Semiotic Labs、The Guild、Messari和GraphOps是The Graph生态系统中的七个组织。


关于Semiotic Labs AI团队


Ahmet S. Ozcan


Ahmet是Semiotic的联合创始人和CEO。在担任目前的职务之前,Ahmet曾担任Machine Intelligence group的经理,领导大脑启发的人工智能算法研究和硬件加速,包括在IBM神经计算机上的首次应用开发。艾Ahmet拥有波士顿大学的物理学博士学位,是IBM的发明大师,名下有100多项专利。他广泛的研究贡献包括在领先的科学杂志上发表了50多篇同行评议的文章,横跨不同的学科,如计算机科学、认知心理学、神经科学、物理学和微电子。(https://www.linkedin.com/in/asozcan/)


Sam Green


Sam Green是Semiotic的联合创始人和研究主管。2009年,在完成应用数学的硕士学位后,他在一家嵌入式电子咨询公司工作,为实时应用开发低级别的微控制器代码。2010年,他加入桑迪亚国家实验室,专门使用统计学和机器学习来分析加密硬件的弱点。2015年,山姆离开桑迪亚,在加州大学圣巴巴拉分校攻读博士学位。他的论文结合了深度学习和强化学习,并专注于建立能够在不确定条件下有效执行(例如,低功耗或高速)决策的人工智能代理。他在完成学位期间再次为桑迪亚公司工作,从事发现硬件友好型神经架构的研究。(https://www.linkedin.com/in/0xsamgreen/)


Alexis Asseman


Alexis是Semiotic的联合创始人和首席开发人员。在完成微纳米技术的硕士学位后,他加入了IBM研究院的机器智能部门。在IBM工作期间,Alexis是IBM神经计算机的首席开发者,该计算机是用400多块FPGA(高性能可重构硬件)建成的。他利用神经计算机进行大规模的神经进化实验。Alexis还进行了关于记忆增强的神经网络和视觉问题回答的语言模型的研究。他还帮助建立了MI-Prometheus,一个开源的深度学习库。


Anirudh Patel


Anirudh是Semiotic公司的高级研究科学家。Anirudh拥有斯坦福大学的电子工程硕士学位,专注于信号处理。在研究生阶段,在从事医学图像处理工作时,他被深度学习在胸部X射线肺炎分类中的成功所激励。因此,他把重点转向了计算机视觉。2018年完成硕士学位后,阿尼鲁德去了桑迪亚国家实验室,作为深度学习的 "主题专家 "为研发项目做出了贡献。因此,他参与了许多不同领域的深度学习项目,如深度强化学习、语义分割、物体检测,以及在嵌入式架构上部署深度学习算法。在桑迪亚,他经常作为研究计划可行性的筛选测试,并组织研讨会和培训,以提高对深度学习技术的兴趣。当他加入Semiotic时,他已经专门研究了分散的多Agent协调。(https://www.linkedin.com/in/anirudh-patel-7124a1b8/)


Tomasz Kornuta


Tomasz于2022年加入Semiotic实验室,担任工程副总裁和人工智能主管。Tomasz拥有机器人和控制方面的博士学位,过去曾研究过机器人控制与计算机视觉相结合的各种问题,应用于视觉伺服、场景合成和物体操作。2015年,他加入了IBM研究院,从事利用注意力和记忆的神经网络研究,以及视觉问题回答和视频推理的多模态机器学习。2019年,Tomasz加入英伟达人工智能应用团队,更多参与到纯自然语言处理研究中,利用自监督学习和大型语言模型(LLM)的最新进展,从事对话管理和语义搜索的研究。Tomasz是80多篇同行评议文章的作者和4项美国专利的发明人,研究主题从机器人和控制,到计算机视觉、自然语言处理和机器学习。他还组织了十几场专门讨论这些主题的会议研讨会和特别会议。托马斯还担任各种期刊和会议的审稿人,并编辑了一本专门讨论三维机器人感知的专刊。最后,他参与了一些研究项目和资助,包括DARPA的资助和欧盟的两个第七框架计划资助。


  The Graph 官方渠道                       

             

官方网站:           

https://thegraph.com/   

   

官方电报:               

https://t.me/GraphProtocolCN               

     

官方推特:                     

@graphprotocol               

       

中文推特:           @TheGraphCN               

           

官方Discord:            https://thegraph.com/discord                       官方Blog:                                                

https://thegraph.com/blog/                 

  

官方Github:                

https://github.com/graphprotocol                                                          

点击  阅读原文 阅读英文版


                           


                           


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存