研究人员如何用英伟达GPU模拟量子比特？

Original 光子盒研究院光子盒 2024-03-26

光子盒研究院

本月，英伟达在量子计算领域掀起了一阵波澜：它将英特尔的Grace Hopper芯片与量子处理器直接集成，并展示了在经典超级计算机上模拟量子系统的能力。
在量子计算领域，英伟达无疑处于有利地位：它生产超级计算机使用的GPU、也是人工智能开发者渴望得到的GPU；这些GPU也是在经典计算机上模拟数十个量子比特的重要工具。新软件的开发意味着研究人员现在可以使用越来越多的超级计算资源来代替真正的量子计算机。
但是，模拟量子系统是一项独特的高难度挑战，而且这些需求还在不断增长。

迄今为止，很少有量子计算机模拟能够访问一个以上的多GPU节点，甚至只有一个GPU。不过，英伟达最近在幕后取得了进展，现在有可能缓解这些瓶颈。
经典计算机在模拟量子硬件方面有两个作用：
首先，量子计算机制造商可以利用经典计算来测试运行他们的设计。伦敦帝国理工学院博士后研究员Jinzhao Sun说：“经典模拟是理解和设计量子硬件的一个基本方面，经常是验证这些量子系统的唯一手段。”
另外，经典计算机可以代替实际的量子计算机运行量子算法。研究分子动力学、蛋白质折叠和新兴的量子机器学习等应用的研究人员尤其对这种能力感兴趣——因为所有这些应用都受益于量子处理。
经典模拟并不能完美替代真正的量子物品，但它们经常能做出合适的仿制品。世界上只有那么多量子计算机，而经典模拟更容易获得。经典模拟还能控制困扰真正量子处理器的噪音，这些噪音往往会破坏量子运行。位于纽约州厄普顿的布鲁克海文国家实验室(Brookhaven National Laboratory)的计算机科学与机器学习研究员Shinjae Yoo表示，经典模拟可能比真正的量子模拟慢，但研究人员仍然可以通过减少运行次数来节省时间。
那么，问题就出在尺寸上。由于量子系统中的一个量子比特与该系统中的其他量子比特纠缠在一起，因此精确模拟该系统的要求呈指数级增长。根据经验，每增加一个量子比特，模拟所需的经典内存就会增加一倍：从单个GPU到整个八GPU节点，就增加了三个量子比特。
许多研究人员仍然梦想着在这个指数级的斜坡上越走越远。Yoo说：“比方说，如果我们正在进行分子动力学模拟，我们就需要更多的原子和更大规模的模拟，以获得更逼真的模拟效果。”

GPU是关键的立足点。
Yoo说，用GPU取代CPU可以将量子系统的模拟速度提高一个数量级。这种加速可能并不令人惊讶，但由于在GPU之间发送信息存在瓶颈，很少有模拟能够充分利用这一优势。因此，大多数模拟都局限于一个多GPU节点，甚至是该节点中的单个GPU。

cuQuantum Appliance在英伟达H100 80GB Tensor Core GPU上对量子傅立叶变换、Shor算法和量子霸权电路等流行量子算法的模拟速度比在双Intel Xeon Platinum 8480C CPU上的CPU实现速度提高了90-369倍
网址链接：https://developer.nvidia.com/cuquantum-sdk
现在，一些幕后的进步正在使这些瓶颈得到缓解。典型例子是，英伟达的cuQuantum软件开发工具包让研究人员可以更轻松地跨多个GPU运行量子模拟。以前，GPU需要通过CPU进行通信，这会造成额外的瓶颈，而像英伟达的NCCL这样的集合通信框架可以让用户在节点之间直接进行内存到内存的复制等操作。
cuQuantum与加拿大初创公司Xanadu的PennyLane等量子计算工具包配对使用。PennyLane是量子机器学习领域的中坚力量，它能让研究人员在量子计算机上使用PyTorch等技术。虽然PennyLane是为在真正的量子硬件上使用而设计的，但PennyLane的开发人员特别增加了在多个GPU节点上运行的功能。
GPU是关键的立足点。Yoo认为，用GPU取代CPU可以将量子系统的模拟速度提高一个数量级。
在纸面上，这些进步可以让经典计算机模拟约36量子比特。实际上，这种规模的模拟需要太多的节点时间，并不实用；如今，更现实的黄金标准是20个以上。尽管如此，这仍然比研究人员几年前所能模拟的量级多出了10量子比特。

Perlmutter列出的系统性能
Yoo是在Perlmutter超级计算机上完成他的工作的，这台超级计算机由数千个英伟达A100 GPU构建而成，这些GPU因其在训练和运行人工智能模型方面的卓越性能而备受追捧，西方还有不少超级计算机使用A100作为骨干。

经典硬件的体积还能继续增长吗？挑战是巨大的。从160GB GP内存的英伟达DGX到320GB GPU内存的英伟达DGX，仅仅是一个量子比特的跳跃。不过，Jinzhao Sun认为，试图模拟超过100个量子比特的经典模拟很可能会失败。
真正的量子硬件，至少从表面上看，早已超过了这些比特数。例如，IBM已将自己的通用量子处理器中的量子比特数量稳步提升到数百个，并雄心勃勃地计划将这些数量提升到数千个。
这并不意味着模拟在千量子比特的未来不会发挥作用。经典计算机可以在模拟大型系统的某些部分方面发挥重要作用：验证其硬件或测试算法，而这些算法有朝一日可能会在全尺寸系统中运行。
事实证明，29量子比特可以做很多事情。
参考链接：[1]https://www.nvidia.com/en-us/industries/supercomputing/[2]https://spectrum.ieee.org/nvidia-qubit[3]https://www.bnl.gov/staff/sjyoo

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

有的人走了，却永远活着

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

研究人员如何用英伟达GPU模拟量子比特？

您可能也对以下帖子感兴趣

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

有的人走了，却永远活着

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

生成图片，分享到微信朋友圈

研究人员如何用英伟达GPU模拟量子比特？

您可能也对以下帖子感兴趣