量子计算算法的前沿进展与未来展望
1. 量子算法的发展历程
20世纪90年代,第一代量子算法应运而生,那时量子计算机仅仅是一个概念。一方面,缺乏实际的量子硬件是一个巨大的劣势,因为这使得直接实验变得不可能;另一方面,这也刺激了理论研究,使其不受早期不完善量子计算机的限制和约束。研究人员专注于设计能够实现二次甚至指数级加速的算法,假设未来有一天会出现强大且无误差的量子计算机。正是在这个时期,Shor的素因数分解算法和Grover的搜索算法被发现。
如今,距离第一代量子算法的出现已经过去了四分之一个世纪,我们面临着不同的问题:开发实用的量子计算算法和技术,以便从含噪声中等规模量子(NISQ)计算机中提取价值。尽管量子计算硬件正在以惊人的速度改进,但距离能够破解RSA加密的状态仍有很大差距。那么,现有的量子计算机能够做什么?与经典计算机相比,它们的相对优势是什么?接下来,我们将介绍几种新的、适合NISQ的算法,这些算法让我们离实现量子优势更近了一步。
2. 量子核方法
2.1 经典核方法
核方法是强大的经典监督学习算法——支持向量机(SVM)的关键要素。与基于前馈神经网络的分类器不同,SVM的目标是最大化间隔,即分离超平面(区分不同类样本的决策边界)与最接近该超平面的训练样本之间的距离。最接近分离超平面的样本被称为支持向量,这也是该算法名称的由来。
最大化间隔可以降低泛化误差并有助于防止过拟合。然而,对于非线性可分的数据,找到分离超平面并非易事。幸运的是,核方法通过创建原始特征的非线性组合并将其投影到更高维的空间,使得数据样本在该空间中变得线性可分,从而克服了这一困难。
对于线性可分的数据,SVM基于训练样本的内积⟨xi, xj⟩进行操作;而对于非线性可分的数据,广义版本的SVM则基于核函数k(xi, xj) := ϕ(xi)⊤ϕ(xj)进行操作,其中ϕ : RN →RM(M ≫ N)是将N维特征x := (x1, …, xN)投影到M维特征空间的特征映射。直接计算内积(13.1.1)在计算上是昂贵的,但核函数的计算成本较低,这就是所谓的核技巧。核函数可以看作是对一对样本进行操作的相似性函数。例如,径向基函数k(xi, xj) = exp(−∥xi - xj∥2 / 2σ2)将样本xi和xj之间的距离(定义在[0, ∞)N上)转换为相似性得分(定义在区间[0, 1]上)。
选择合适的核函数可以使分类任务变得更加容易。然而,有些核函数可能难以计算。在这种情况下,量子计算可以发挥重要作用,通过提供高效的量子电路来计算这些核函数。
2.2 量子核方法
Wang等人表明,经典核和量子核之间存在密切的对应关系。特征映射ϕ(·)与通过参数化量子电路U(·)制备量子态相吻合,该电路将输入数据样本映射到由n个量子比特描述的高维希尔伯特空间:ϕ(x) → |ψ(x)⟩ = U(x) |0⟩⊗n。
核函数则与对制备好的量子态进行测量相吻合:k(xi, xj) → |⟨ψ(xj)|ψ(xi)⟩|2。与替代方案k(xi, xj) = ϕ(xi)⊤ϕ(xj) → ⟨ψ(xj)|ψ(xi)⟩相比,这种量子核允许更具表现力的模型。Huang等人认为,尽管核函数(13.1.3)似乎更自然,但量子核(13.1.2)可以学习任意深度的量子神经网络。
Havlíček等人描述了如何使用量子计算机来估计核。核项是不同特征向量之间的保真度(类似于经典核方法中的相似性得分)。Burnham等人和Cincio等人研究了各种保真度估计方法,如量子指纹识别和机器学习方法(均依赖于应用实现交换测试的CSWAP门)。然而,通过利用特征空间中的状态并非任意的这一事实,可以从转移概率估计量子态之间的重叠:|⟨ψ(xj)|ψ(xi)⟩|2 = | ⟨0| U†(xj)U(xi) |0⟩|2。
具体步骤如下:
1. 将两个连续的特征映射电路(表示算子U(xi)和U†(xj))应用于初始状态|0⟩。
2. 在计算基下对最终状态进行K次测量,并统计全零字符串|0⟩的数量κ。
3. 全零字符串的频率κ/K就是转移概率(“相似性得分”)的估计值。
其余的监督学习协议是经典的,允许将量子计算的核自然地嵌入到整个框架中:该算法本质上仍然是经典的,只是将经典上困难的任务外包给了量子芯片。
2.3 特征映射的量子电路
图1展示了特征映射电路的示意图。在这个例子中,我们处理一个8维的数据集,特征编码在旋转角度中,使得样本xi := (xi1, …, xi8)可以直接映射到可调电路参数向量θi := (θi1, …, θi8)。电路的第一部分实现算子U(xi),由于固定的双量子比特CZ门层,创建了一个纠缠态;而电路的第二部分实现U†(xj)。这里我们利用了RX†(θ) = RX(−θ)、RY†(θ) = RY(−θ)和CZ† = CZ的事实。
graph TD;
A[|0⟩] --> B[RY(θi1)];
C[|0⟩] --> D[RY(θi2)];
E[|0⟩] --> F[RY(θi3)];
G[|0⟩] --> H[RY(θi4)];
I[|0⟩] --> J[RX(θi5)];
K[|0⟩] --> L[RX(θi6)];
M[|0⟩] --> N[RX(θi7)];
O[|0⟩] --> P[RX(θi8)];
B --> Q[RX(−θj5)];
D --> R[RX(−θj6)];
F --> S[RX(−θj7)];
H --> T[RX(−θj8)];
J --> U[RY(−θj1)];
L --> V[RY(−θj2)];
N --> W[RY(−θj3)];
P --> X[RY(−θj4)];
Q --> Y[M];
R --> Y;
S --> Y;
T --> Y;
U --> Y;
V --> Y;
W --> Y;
X --> Y;
Y --> Z[Z];
图1:量子核电路示意图
如果样本xi和xj相同(即θi = θj),那么U(xi)U†(xj) = I,所有K次测量都将返回全零字符串|0⟩。
我们将量子核方法应用于澳大利亚信用审批数据集,以估计从同一类中抽取的样本和从两个不同类中抽取的样本之间的相似度。该数据集由690个样本组成,其中383个样本标记为类别0,307个样本标记为类别1,数据集相当平衡。每个样本由14个特征(连续、整数、二进制)组成。我们希望构建一个与角度编码方案一致且不需要构建太深的参数化量子电路(PQC)的特征映射。实际上,我们希望使用尽可能接近图1所示的PQC来构建特征映射。该方案可以嵌入到我们之前考虑的所有现有NISQ系统中。例如,我们可以使用IBM的墨尔本系统。
表1展示了使用量子核(13.1.2)在Qiskit模拟器上对每对数据样本运行量子电路K = 10,000次得到的转移概率(相似性得分)的平均值。
| 类别对 | 平均相似性得分 |
| ---- | ---- |
| 类别0 / 类别0 | 8.1 × 10−2 |
| 类别1 / 类别1 | 8.4 × 10−2 |
| 类别0 / 类别1 | 3.8 × 10−2 |
正如预期的那样,从同一类中抽取的样本平均而言,由量子核给出的相似性得分明显高于从两个不同类中抽取的样本。能够在量子计算机上高效计算的量子核有潜力提高混合量子 - 经典机器学习模型的性能。
3. 量子生成对抗网络
生成对抗网络(GANs)是强大的统计技术,用于生成(根据需要尽可能多的)在某种意义上与给定样本接近的数据。它们最初在图像数据上进行了测试,此后在金融领域得到了广泛应用,如时间序列生成、交易模型调整、投资组合管理、合成数据生成和各种类型的欺诈检测。
GANs的核心思想是让生成器和判别器相互竞争以提高自身性能:生成器通过更好地从随机噪声中生成好的样本(即接近真实数据的样本)来改进,而判别器通过能够识别真实数据和“假”(即生成的)数据来改进。生成器和判别器通常都构建为神经网络,需要对超参数进行优化。
从数学上讲,给定生成器G(·, θG)和判别器D(·, θD),其中θG和θD表示超参数,问题可以表述为:
minθG maxθD {Ex∼Pdata [log(D(x; θD))] + Ez∼PG(·,θG) [log(1 - D(G(z; θG); θD))]}
量子生成对抗网络(QGAN)的主要原理与经典GANs相同,依赖于生成器和判别器两个参与者相互竞争。Lloyd等人和Dallaire - Demers等人同时引入了QGAN。在Lloyd等人的研究中,作者将经典问题转化为密度矩阵的语言。给定由密度矩阵σ表示的一些数据(不一定描述纯态)和生成一些输出密度矩阵ρ的生成器G,判别器的任务是识别真实数据和假数据。具体来说,它进行正算子值测量,结果为T(真)或F(假)。给定真实数据时测量得到正答案的概率为P(T|σ) = Tr(Tσ),给定生成数据时测量得到正答案的概率为P(T|G) = Tr(Tρ)。
对抗游戏可以表示为:
minG maxT {Tr(Tρ) - Tr(Tσ)}
需要注意的是,正测量算子T的集合(1 - 范数小于1)和密度矩阵ρ的集合都是凸的,这确保了优化问题至少有一个最优解。然而,这两个集合是无限维的,使得优化问题难以解决。Dallaire - Demers等人进一步提出将生成器和判别器都建模为参数化的变分量子电路,例如由旋转角度等参数描述。
从n个量子比特开始,量子生成器G : C2n → C2n采用多层量子神经网络的形式,例如:
G := ∏l = L1 Ul(θl)
对于每一层l ∈ {1, …, L},酉门Ul(θl)同时作用于所有n个量子比特,并依赖于参数向量(或超参数)θl。为了避免(过于昂贵的)高阶量子比特门,纠缠采用成对受控酉门的形式,因此我们假设对于每一层l,Ul仅由单量子比特门或双量子比特门组成。一种可能的参数化Ul的方法是基于以下原则:
- 任何单量子比特酉门都可以分解为三个旋转门RZ、RX和RY的序列。
- 非本原双量子比特门(即将乘积态映射到非乘积态的双量子比特门)与单量子比特门一起确保量子通用性。特别是,分解RX(θ)Q(ϕ)是通用的,其中:
Q(ϕ) :=
| 1 0 0 0 |
| 0 1 0 0 |
| 0 0 1 0 |
| 0 0 0 eiϕ |
每层的总超参数数量为5n,因此总共为5nL。判别器本身可能是量子性质的,也可能不是,这取决于具体问题。有限维优化通常通过某种梯度下降方法进行,梯度本身可以通过单独的量子电路计算,或者更高效地使用参数偏移规则计算。
QGAN是一个非常新且活跃的研究领域,有望成为NISQ算法特别有成效的领域。它与量子神经网络(QNN)的整体发展密切相关,目前该领域的进展包括:
- QGAN生成概率分布:可参考相关研究,用于单变量分布(主要在金融领域)和多变量分布。
- 量子卷积神经网络:相关研究展示了如何处理(量子)深度神经网络中的非线性问题,解释了如何减少电路中所需的门数量(等效于旋转参数的数量),并强调了双量子比特相互作用的重要性和充分性,更适合NISQ设备。
- 量子Wasserstein GAN:模仿经典Wasserstein GAN的最新结果,作者引入了量子数据之间的Wasserstein半度量,用于减少所需的量子门数量。
4. 贝叶斯量子电路
参数化量子电路可用于构建具有所需特性的量子态,并以可控的方式对其进行修改。测量最终状态相当于从概率分布中以比特串的形式抽取样本,这是量子电路玻恩机(QCBM)的关键概念。
贝叶斯量子电路(BQC)是另一种量子生成机器学习模型,它扩展了QCBM的能力。与仅对编码所需概率分布的数据量子比特进行操作的QCBM不同,BQC有额外的辅助量子比特来编码先验分布。
BQC电路如图2所示:
graph TD;
A[|0⟩] --> B[U(γ1)];
C[|0⟩] --> B;
D[|0⟩] --> B;
E[|0⟩] --> B;
F[|0⟩] --> B;
G[|0⟩] --> B;
B --> H[U(γK)];
H --> I[M];
J[|0⟩] --> K[U(β11)];
L[|0⟩] --> K;
M[|0⟩] --> K;
N[|0⟩] --> K;
O[|0⟩] --> K;
P[|0⟩] --> K;
K --> Q[U(βl1)];
Q --> R[M];
S[|0⟩] --> T[U(β12)];
U[|0⟩] --> T;
V[|0⟩] --> T;
W[|0⟩] --> T;
X[|0⟩] --> T;
Y[|0⟩] --> T;
T --> Z[U(βlm)];
Z --> AA[M];
图2:BQC示意图
电路中的前m个量子寄存器是辅助量子比特。在将K个算子块U(γi)(i = 1, …, K)应用于初始状态|0⟩⊗m后,我们构建状态|ψ⟩:
|ψ⟩ = ∏i = 1K U(γi) |0⟩⊗m
测量该状态会生成来自先验分布的样本。接下来的n个量子寄存器是数据量子比特,作用于它们的量子门取决于辅助量子比特的状态。有条件地将l × m个算子块应用于n个数据量子比特,我们得到一个依赖于|ψ⟩的状态。测量该状态将生成来自条件分布的样本,这正是实现贝叶斯模型所需的。
贝叶斯建模允许我们使用贝叶斯定理推断给定一些观测数据D时模型参数θ的后验分布:
P(θ|D) = P(D|θ)P(θ) / P(D) = P(D|θ)P(θ) / ∫P(D|θ)P(θ)dθ
其中P(D|θ)是似然,P(D)是边际似然或证据,P(θ)是先验。我们通过重复测量由(13.3.1)给出的状态|ψ⟩来获得P(θ),通过重复测量应用条件算子U(β)后的最终状态来获得P(D|θ),通过重复测量无条件应用算子U(β)后的最终状态来获得P(D)。
在BQC的情况下,先验由参数γ := (γ1, …, γK)参数化。后验可以用于使用后验预测来建模新的未见过的数据D∗:
P(D∗|D) = ∫P(D∗|θ)P(θ|D)dθ
这个积分对所有合理模型的预测进行平均,权重为后验概率,被称为贝叶斯模型平均。
BQC可以通过最小化最大均值差异成本函数来训练。从计算复杂度的角度来看,Du等人表明,与多参数量子电路(MPQC)相比,BQC具有更好的表达能力。
贝叶斯网络可用于金融资产价格预测、预测限价订单簿市场的动态、预测企业破产以及建模、分析和理解交易行为。贝叶斯量子电路模型通过添加编码先验分布的辅助量子寄存器,扩展了作为生成模型训练的参数化量子电路(QCBM)的能力。因此,它比MPQC具有更强的表达能力。
5. 量子半定规划
5.1 经典半定规划
在半定规划(SDP)中,我们在对称矩阵的仿射组合为半正定的约束下优化线性函数。这种约束是非线性和非光滑的,但却是凸的,因此半定规划是凸优化问题。半定规划统一了几个标准问题(如线性和二次规划),并在工程和组合优化中找到许多应用。
SDP可以一般地定义为以下优化问题:
maxX∈M+N(R) Tr(CX)
subject to Tr(AjX) ≤ bj, for all j ∈ [[M]]
其中[[M]] := {1, …, M},M+n (R)表示大小为N×N的半正定矩阵的集合。这里,MN(R)中的厄米矩阵(Aj)j = 1, …, M和C以及(bj)j∈[[M]] ∈ RM是问题的输入。
SDP可以应用于复杂的NP - 难优化问题,如各种投资组合优化问题。例如,通常假设资产回报的分布是确切已知的是不现实的,必要的信息可能不完整,估计会受到估计误差和建模误差的影响。
5.2 最大风险分析
经典的最大风险分析问题,假设资产回报的协方差矩阵Σ的估计存在不确定性,可以表述为:
maxΣ∈M+N(R) w⊤Σw
subject to ΣLij ≤ Σij ≤ ΣUij, for all i, j ∈ [[N]]
其中w是固定的权重向量,Σ是问题变量。对于每个i, j ∈ [[N]],矩阵ΣLij和ΣUij是M+N(R)中的固定约束。任务是在已知资产配置的情况下,确定资产回报协方差矩阵估计存在不确定性时的最大可能投资组合风险。该问题可以表示为以下SDP:
maxΣ∈M+N(R) Tr(w⊤Σw)
subject to
{
Tr(−EijΣ) ≤ −ΣLij,
Tr(EijΣ) ≤ ΣUij,
for all (i, j) ∈ [[N]] × [[N]]
}
其中我们表示(Eij)αβ := δiαδjβ。最大风险分析问题可以用不同的风险度量(如风险价值(VaR)或预期短缺)以相同的形式表示。
5.3 稳健投资组合构建
稳健投资组合构建问题的目标是找到一种资产配置方法,使建议的资产配置权重的估计误差最小化。该问题已经通过蒙特卡罗模拟进行了研究,以确定给定投资组合在输入协方差矩阵发生小变化时最稳健的资产配置方法。
在最一般的情况下,它可以表述为最小 - 最大问题:
minw∈W maxΣ∈S w⊤Σw
with
S := {Σ ∈ M+N(R) : ΣLij ≤ Σij ≤ ΣUij, for all i, j ∈ [[N]]}
W := {w ∈ RN : 1⊤w = 1, μ⊤w ≥ Rmin}
其中w是权重向量,μ是预期资产回报向量,Σ是资产回报的协方差矩阵。
冯·诺伊曼在1928年证明的以下定理建立了最小 - 最大和最大 - 最小优化问题的等价性:
定理11(极小极大定理):设X ⊂ Rn和Y ⊂ Rm是紧凸集。如果函数f : X × Y → R对于固定的y在x上是连续且凹的,对于固定的x在y上是连续且凸的,那么
miny∈Y maxx∈X f(x, y) = maxx∈X miny∈Y f(x, y)
因此,一般来说,最小 - 最大稳健投资组合构建问题(在w上是凸的,在Σ上是凹的)等价于最大 - 最小问题,并且可以针对上述约束表示为所有变量的SDP。
5.4 量子半定规划
量子半定规划(QSDP)的关键思想基于这样的观察:归一化的半正定矩阵可以自然地表示为量子态。在量子计算机上对量子态进行操作有时比在经典计算机上进行相应的矩阵操作在计算上更便宜。这一想法促使了SDP量子算法的发展。
考虑SDP(13.4.1),并设ε > 0很小。如果对于所有输入g ∈ R和ζ ∈ (0, 1),一个算法以成功概率1 - ζ找到向量y ∈ RM+1和实数z,使得对于密度矩阵
ρ = exp(−∑j = 1M yjAj + y0C) / Tr(exp(−∑j = 1M yjAj + y0C))
我们有zρ是一个ε - 可行解,目标值至少为g - ε,即
{
Tr(zρAj) ≤ bj + ε, for all j ∈ [[M]],
Tr(zρC) ≥ g - ε
}
或者得出即使设置ε = 0也不存在这样的z和y的结论,那么该算法被称为ε - 近似量子SDP预言机。
Brandão和Svore使用Arora - Kale框架实现了一个用于稀疏矩阵的通用QSDP求解器。他们观察到(13.4.2)中的密度矩阵ρ实际上是一个log(N) - 量子比特的吉布斯态,可以在量子计算机上有效地制备为量子态。
读者应该已经熟悉吉布斯态(吉布斯分布)的形式:
ρ = e−βH / Tr(e−βH)
其中H是问题哈密顿量,Tr(exp(−βH))是配分函数。QSDP在解决SDP问题上比任何经典方法在N和M上都有平方根的无条件加速。量子半定规划是另一个可以实现量子加速的例子,因为在量子计算机上对量子态进行操作比在经典计算机上进行相应的矩阵操作在计算上更便宜。
量子计算算法的前沿进展与未来展望
6. 超越NISQ的重要量子算法
在当前NISQ计算机的基础上,还有一些重要的量子算法依赖于具备更强大特性的量子计算硬件。这些算法的存在及其实现二次甚至指数级加速的潜力,为量子计算机的快速发展提供了强大动力。
6.1 量子傅里叶变换
在经典环境中,离散傅里叶变换将向量 $x := (x_0, \ldots, x_{2^n - 1}) \in \mathbb{C}^{2^n}$ 映射到向量 $y := (y_0, \ldots, y_{2^n - 1}) \in \mathbb{C}^{2^n}$,其分量为:
$y_k = \frac{1}{\sqrt{2^n}} \sum_{j = 0}^{2^n - 1} \exp(\frac{2\pi ijk}{2^n}) x_j$,对于每个 $k = 0, \ldots, 2^n - 1$。
类似地,量子傅里叶变换是线性映射:
$|k\rangle \longrightarrow \frac{1}{\sqrt{2^n}} \sum_{j = 0}^{2^n - 1} \exp(\frac{2\pi i kj}{2^n}) |j\rangle$
算子 $qF := \frac{1}{\sqrt{2^n}} \sum_{k,j = 0}^{2^n - 1} \exp(\frac{2\pi i kj}{2^n}) |j\rangle \langle k|$ 表示傅里叶变换矩阵,它是酉矩阵,因为 $qFqF^{\dagger} = I$。
在一个 $n$ 量子比特系统中,对于给定状态 $|j\rangle$,使用二进制表示 $j := j_1 \cdots j_n$,其中 $(j_1, \ldots, j_n) \in {0, 1}^n$,使得 $|j\rangle = |j_1 \cdots j_n\rangle = |j_1\rangle \otimes \cdots \otimes |j_n\rangle$。经过代数运算可得:
$qF |j\rangle = \frac{1}{\sqrt{2^n}} (|0\rangle + e^{2\pi i 0.j_n} |1\rangle) \otimes (|0\rangle + e^{2\pi i 0.j_{n - 1}j_n} |1\rangle) \otimes \cdots \otimes (|0\rangle + e^{2\pi i 0.j_1 \cdots j_n} |1\rangle)$
6.2 量子相位估计
量子相位估计(QPE)的目标是为给定的酉算子 $U$ 及其特征向量 $|u\rangle$ 和特征值 $\exp(2\pi i\varphi)$ 估计未知相位 $\varphi \in [0, 1)$。
考虑一个大小为 $m$ 的寄存器,定义 $b^ := \sup_{j \leq 2^m\varphi} {j = 2^m 0.j_1 \cdots j_m}$。这样,$2^{-m}b^ = 0.b_1 \cdots b_m$ 是 $\varphi$ 的最佳 $m$ 位近似值。
QPE 过程使用两个寄存器,第一个包含 $m$ 个初始状态为 $|0\rangle$ 的量子比特。选择 $m$ 取决于对 $\varphi$ 估计的精度位数以及我们希望获得成功相位估计过程的概率。
QPE 允许我们对任何厄米算子进行测量。如果要测量更复杂的可观测量,可以使用 QPE 实现冯·诺依曼测量方案。该例程在一个寄存器中准备厄米算子的特征态,并将相应的特征值存储在第二个寄存器中。
量子相位电路(经过 SWAP 变换)的输出为:
$|\psi\rangle = \frac{1}{\sqrt{2^m}} (|0\rangle + e^{2\pi i 0.\varphi_m} |1\rangle) \otimes (|0\rangle + e^{2\pi i 0.\varphi_{m - 1}\varphi_m} |1\rangle) \otimes \cdots \otimes (|0\rangle + e^{2\pi i 0.\varphi_1 \cdots \varphi_m} |1\rangle)$
这正好等于状态 $|2^m\varphi\rangle = |\varphi_1\varphi_2 \cdots \varphi_m\rangle$ 的量子傅里叶变换,即 $|\psi\rangle = qF |2^m\varphi\rangle$。由于量子傅里叶变换是酉变换,我们可以通过逆过程检索 $|2^m\varphi\rangle$。
以下是 QPE 过程的伪代码:
算法 10: 量子相位估计
输入:
• 酉矩阵(门)U,满足 U |u⟩ = e^{2\pi i\varphi} |u⟩;
• m 个初始化为 |0⟩ 的辅助量子比特。
1: 准备初始状态,|0⟩^{\otimes m} 作为 m 量子比特辅助寄存器,|u⟩ 作为 n 量子比特特征态寄存器。
2: 对辅助寄存器应用哈达玛门,映射到 \frac{1}{\sqrt{2^m}} \sum_{j = 0}^{2^m - 1} |j⟩ |u⟩。
3: 对特征态寄存器应用受控 U^j 门,映射到 \frac{1}{\sqrt{2^m}} \sum_{j = 0}^{2^m - 1} |j⟩ U^j |u⟩ = \frac{1}{\sqrt{2^m}} \sum_{j = 0}^{2^m - 1} |j⟩ e^{2\pi i j\varphi} |u⟩。
4: 使用逆量子傅里叶变换计算 |\tilde{\varphi}\rangle |u⟩,其中 \tilde{\varphi} 是 \varphi 的 m 量子比特近似值。
5: 测量以推断 \tilde{\varphi}。
结果: 相位估计 \tilde{\varphi}。
6.3 蒙特卡罗加速
利用量子相位估计提供的加速,Montanaro 设计了一种蒙特卡罗方案,与经典方案相比实现了量子加速。
- 经典蒙特卡罗 :蒙特卡罗技术是模拟随机过程统计量的广泛方法。考虑一维随机变量 $X$ 和函数 $\phi : \mathbb{R} \to [0, 1]$,使得 $p := E[\phi(X)]$ 和 $\sigma^2 := V[\phi(X)]$ 都有定义。根据中心极限定理,给定独立同分布的随机变量 $(X_1, \ldots, X_N)$ 且分布与 $X$ 相同,那么 $\frac{\sqrt{N}(\hat{p} N - p)}{\sigma}$ 当 $N$ 趋于无穷时收敛到均值为 0、方差为 1 的高斯分布 $N(0, 1)$,其中 $\hat{p}_N := \frac{1}{N} \sum {i = 1}^{N} X_i$ 是经验均值。这意味着,对于任何 $\epsilon > 0$,我们可以估计 $P(|\hat{p}_N - p| \leq \epsilon) = P(|N(0, 1)| \leq \frac{\epsilon \sqrt{N}}{\sigma})$。为了得到形式为 $P(|\hat{p}_N - p| \leq z) = 1 - \delta$ 的估计,我们需要 $N = O(1/\epsilon^2)$ 个样本。
- 量子蒙特卡罗 :考虑形式为 $A |0\rangle^{\otimes n} = \sum_{x \in {0, 1}^k} \alpha_x |\psi_x\rangle |x\rangle$ 的算子 $A$,其中每个 $|\psi_x\rangle$ 是 $n - k$ 个量子比特的量子态,$|x\rangle$ 是 $k$ 个量子比特的量子态,$\alpha_x \in \mathbb{C}$ 是振幅。假设存在算子 $W$ 满足 $W |x\rangle |0\rangle = |x\rangle (\sqrt{1 - \phi(x)} |0\rangle + \sqrt{\phi(x)} |1\rangle)$。
定义算子 $M := (I_{n - k} \otimes W)(A \otimes I)$,则 $|\psi\rangle := M |0\rangle^{\otimes (n + 1)} = \sum_{x \in {0, 1}^k} \alpha_x |\psi_x\rangle |x\rangle (\sqrt{1 - \phi(x)} |0\rangle + \sqrt{\phi(x)} |1\rangle) =: |\Psi_B\rangle |0\rangle + |\Psi_G\rangle |1\rangle$,其中 $|\Psi_B\rangle := \sum_{x \in {0, 1}^k} \alpha_x \sqrt{1 - \phi(x)} |\psi_x\rangle |x\rangle$ 是“坏”状态,$|\Psi_G\rangle := \sum_{x \in {0, 1}^k} \alpha_x \sqrt{\phi(x)} |\psi_x\rangle |x\rangle$ 是“好”状态。
考虑投影算子 $P := I_n |1\rangle \langle 1|$,测量 $|\psi\rangle$ 的最后一个量子比特处于状态 $|1\rangle$ 的概率为 $\langle \psi| P^{\dagger}P |\psi\rangle = |\Psi_G|^2 = \sum_{x \in {0, 1}^k} |\alpha_x|^2 \phi(x)$,这对应于随机变量 $X$ 在集合 ${0, 1}^k$ 上离散化后的期望 $E[\phi(X)]$,其中每个 $|\alpha_x|^2$ 对应于 $X$ 处于 $x$ 的离散概率。
为了获得我们所期望的期望,我们只需运行对应于 $M$ 的电路,在计算基下测量输出,并确定观察到状态 $|1\rangle$ 的概率。
-
量子蒙特卡罗加速
:量子蒙特卡罗的实际加速依赖于振幅估计定理和幂引理的巧妙应用。
振幅估计定理表明,假设我们可以访问量子酉算子 $U$ 使得 $U |0\rangle = \sqrt{1 - p} |\Psi_B\rangle |0\rangle + \sqrt{p} |\Psi_G\rangle |1\rangle$,对于任何 $N \in \mathbb{N}$,振幅估计算法输出估计 $\hat{p}$ 使得 $|\hat{p} - p| \leq \frac{2\pi \sqrt{p(1 - p)}}{N} + \frac{\pi^2}{N^2}$ 的概率至少为 $\frac{8}{\pi^2}$,实现这一点需要恰好 $N$ 次迭代。
幂引理表明,设 $p$ 是要估计的量,$U$ 是输出 $\hat{p}$ 使得 $|\hat{p} - p| \leq \epsilon$ 除了概率小于 $\frac{1}{2}$ 的算法。那么,对于任何 $\delta \in (0, 1)$,只需重复 $U$ 大约 $O(\log(1/\delta))$ 次并取中位数,就可以以至少 $1 - \delta$ 的概率得到 $|\hat{p} - p| \leq \epsilon$。
结合振幅估计定理和幂引理,为了以至少 $1 - \delta$ 的概率获得经验均值 $\langle \psi| P^{\dagger}P |\psi\rangle = |\Psi_G|^2$ 的估计,即 $P(|\hat{p} - p| \leq \epsilon) \geq 1 - \delta$,只需应用算子 $M$ 和 $P$ 大约 $O(N \log(1/\delta))$ 次,其中 $\epsilon = \frac{2\pi \sqrt{p(1 - p)}}{N}$。因此,对于任何固定的 $\delta \in (0, 1)$,计算成本为 $O(1/\epsilon)$,与经典蒙特卡罗相比实现了二次加速。
6.4 量子线性求解器
Harrow、Hassidim 和 Lloyd 设计了一种量子算法来求解线性系统,超越了经典计算时间。线性系统在应用中无处不在,金融定量分析的许多方面都依赖于能够求解此类(低维或高维)系统。
- 理论方面 :问题可以表述为:给定矩阵 $A \in M_N(\mathbb{C})$ 和向量 $b \in \mathbb{C}^N$,找到向量 $x \in \mathbb{C}^N$ 使得 $Ax = b$。为了使算法有效,矩阵 $A$ 需要是厄米矩阵。如果 $A$ 不是厄米矩阵,我们可以考虑增广系统 $\begin{pmatrix} 0_{N,N} & A \ A^{\dagger} & 0_{N,N} \end{pmatrix} \begin{pmatrix} 0_{N,1} \ x \end{pmatrix} = \begin{pmatrix} b \ 0_{N,1} \end{pmatrix}$。假设 $A$ 是厄米矩阵,第一步是将向量 $b$ 编码为量子态 $|b\rangle$,然后将问题重写为 $A |x\rangle = |b\rangle$,我们现在寻找的解是量子态。
由于 $A$ 是厄米矩阵,它有谱分解 $A = \sum_{j = 0}^{N - 1} \lambda_j |\phi_j\rangle \langle \phi_j|$,其中 $\lambda_0, \ldots, \lambda_{N - 1}$ 是其(不一定不同)严格正特征值,对应的特征态为 $|\phi_0\rangle, \ldots, |\phi_{N - 1}\rangle$,其逆为 $A^{-1} = \sum_{j = 0}^{N - 1} \frac{1}{\lambda_j} |\phi_j\rangle \langle \phi_j|$。我们可以将 $|b\rangle$ 分解为 $(|\phi_j\rangle) {j = 0, \ldots, N - 1}$ 基下的形式 $|b\rangle = \sum {j = 0}^{N - 1} b_i |\phi_j\rangle$,因此解为 $|x\rangle = A^{-1} |b\rangle = \sum_{j = 0}^{N - 1} \frac{b_j}{\lambda_j} |\phi_j\rangle$。
以下是量子线性求解器(QLS)算法的伪代码:
算法 11: HHL 量子线性求解器
输入: 厄米矩阵 A 和 nl + nb + 1 个初始化为 |0⟩^{\otimes nl} |0⟩^{\otimes nb} |0⟩ 的量子比特。
1: 使用 nb 个量子比特将数据 b 加载到 |b⟩ 中(N = 2^{nb})。
2: 应用 QPE,其中 U := exp(iAt),之后寄存器的量子态为 \sum_{j = 0}^{N - 1} b_j |\lambda_j\rangle_{nl} |\phi_j\rangle_{nb} |0\rangle。
3: 由 |\lambda_j\rangle_{nl} 控制旋转辅助量子比特 |0⟩,得到 \sum_{j = 0}^{N - 1} b_j |\lambda_j\rangle_{nl} |\phi_j\rangle_{nb} (\sqrt{1 - \frac{C^2}{\lambda_j^2}} |0⟩ + \frac{C}{\lambda_j} |1⟩),其中 C 是归一化常数(|C| < \min_j \lambda_j)。
4: 应用逆 QPE 得到 \sum_{j = 0}^{N - 1} b_j |0⟩_{nl} |\phi_j\rangle_{nb} (\sqrt{1 - \frac{C^2}{\lambda_j^2}} |0⟩ + \frac{C}{\lambda_j} |1⟩)。
5: 在计算基下测量辅助量子比特。如果结果是 |1⟩,寄存器处于测量后状态 \frac{C}{N - 1} \sum_{j = 0}^{N - 1} \frac{b_i}{\lambda_i} |0⟩_{nl} |\phi_j\rangle_{nb},这在归一化因子下对应于解。
结果: 解 |x⟩: |x⟩ = A^{-1} |b⟩ = \sum_{j = 0}^{N - 1} \frac{b_j}{\lambda_j} |\phi_j\rangle。
Harrow、Hassidim 和 Lloyd 表明,假设 $A$ 是稀疏矩阵且条件数为 $\kappa$,该算法的运行时间为 $O(\text{poly}(\log(N), \kappa))$,与经典的 $O(N\sqrt{\kappa})$ 运行时间相比实现了指数级加速。
-
求解偏微分方程
:以有限差分方法求解偏微分方程为例,考虑布莱克 - 斯科尔斯抛物型偏微分方程 $\partial_t V_t + rS \partial_S V_t + \frac{\sigma^2}{2} S^2 \partial_{SS}^2 V_t = rV_t$,通过一系列变换可以将其转化为热方程 $\partial_{\tau} \phi_{\tau}(x) = \frac{\sigma^2}{2} \partial_{xx}^2 \phi_{\tau}(x)$。我们使用显式方案对该偏微分方程进行离散化,将时间和空间轴分别划分为 $n$ 和 $m$ 个区间,在每个节点上近似时间和空间导数。经过近似后,热方程在节点 $(i\delta_T, x_L + j\delta_x)$ 处可以重写为 $\phi_{i + 1, j} = \frac{\delta_T}{\delta_x^2} \frac{\sigma^2}{2} \phi_{i, j + 1} + (1 - \frac{\delta_T}{\delta_x^2} \sigma^2) \phi_{i, j} + \frac{\delta_T}{\delta_x^2} \frac{\sigma^2}{2} \phi_{i, j - 1}$,对于 $i = 0, \ldots, n - 1$,$j = 1, \ldots, m - 1$。将其写成矩阵形式为 $\phi_{i + 1} = A \phi_i + \frac{\alpha \sigma^2}{2} B_i$,其中 $\phi_i := (\phi_{i, 1}, \ldots, \phi_{i, m - 1})^{\top}$,$B_i := (\phi_{i, 0}, 0, \ldots, 0, \phi_{i, m})^{\top}$,$A := T_{m - 1}(1 - \alpha \sigma^2, \frac{\alpha \sigma^2}{2}, \frac{\alpha \sigma^2}{2})$,$\alpha := \frac{\delta_T}{\delta_x^2}$,$T_{m - 1}(\cdot)$ 表示 $(m - 1) \times (m - 1)$ 维的三对角矩阵。忽略边界项 $B_i$ 后,该递归形式与 $Ax = b$ 相同,因此可以使用 HHL 算法求解。
-
投资组合优化应用
:标准的马科维茨型投资组合优化问题(至少对于权重在 ${0, 1}$ 中的情况)可以很容易地表述为线性问题,约束条件通过拉格朗日乘子增加维度。虽然这是一个相对较新的发展,目前结果有限,但已经有一些有前景的实现和细节可参考相关研究。
总结
本文介绍了几种有前途的量子算法。量子核可以在混合量子 - 经典协议中替代经典核;贝叶斯量子电路模型将贝叶斯神经网络的概念扩展到参数化量子电路,比 QCBM/MPQC 具有更强的表达能力;量子半定规划有望超越经典半定规划,是一个活跃的研究领域;此外,还介绍了几种依赖于超越当前 NISQ 计算机能力的量子算法,它们实现二次甚至指数级加速的潜力为量子计算机的发展提供了强大动力。
展望未来,量子计算前景光明。IBM 计划构建以量子为中心的超级计算机,包括量子处理器、经典处理器、量子通信网络和经典网络,预计推出 433 量子比特的 Osprey 处理器和 1121 量子比特的 Condor 处理器。Rigetti 预计在 2023 年推出 84 量子比特的单芯片量子计算机和 336 量子比特的多芯片处理器。IonQ 宣布了一些重大突破,如新型 n 量子比特门。量子退火也在不断发展,D - Wave 计划推出基于 Zephyr 图的 7000 量子比特芯片。我们鼓励读者尝试将量子计算方法应用到自己感兴趣的领域,发现新的量子算法和应用,共同推动量子优势的实现,造福更广泛的社会。
超级会员免费看
50

被折叠的 条评论
为什么被折叠?



