这是用户在 2024-10-8 14:51 为 https://app.immersivetranslate.com/pdf-pro/771e7440-3c2e-4d27-a438-27e891f4b63a 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?

31


量子估计与控制

 马修·R·詹姆斯
澳大利亚国立大学

 罗伯特·L·科苏特
 SC 解决方案

31.1 引言 … 31 1 31 1 31-131-1


量子估计与控制


31.2 一些量子力学 … 31 5 31 5 31-531-5


初步 - 量子公设


力学 - 开放量子系统 - 凸性


和量子力学 - 和谐


振荡器 *\cdot 玻色子场 *\cdot 光学腔


31.3 量子估计的方法和

 控制 … 31 11 31 11 31-1131-11

估计 *\cdot 控制 *\cdot 自适应和学习

 控制

31.4 量子估计 … 31 13 31 13 31-1331-13


量子态层析 *\cdot 量子过程


断层成像 - 哈密顿参数估计


31.5 最优量子反馈控制 … 31 28 31 28 31-2831-28


量子线性系统 - 量子滤波 *\cdot


量子测量反馈 LQG 控制 *\cdot


量子测量反馈 LEQG 控制 *\cdot


量子相干反馈 H H H^(oo)H^{\infty} 控制

 致谢 … 31-39
 参考文献 … 31 39 31 39 31-3931-39

 31.1 介绍


我想描述一个领域,在这个领域里,虽然做得很少,但原则上可以做很多事情。


这个领域与其他领域有所不同,因为它不会告诉我们太多关于基础物理的知识(在“奇异粒子是什么?”的意义上),但它更像固态物理,因为它可能会告诉我们很多关于在复杂情况下发生的奇异现象的有趣信息。


此外,最重要的一点是,它将有大量的技术应用。

我想谈论的是在小规模上操控和控制事物的问题。


一提到这个,人们就告诉我关于微型化的事情,以及它今天的发展程度。他们告诉我有电动机的大小和你小指甲一样。


市场上有一种设备,他们告诉我,可以在针尖上写下主祷文。但这没什么;这只是我打算讨论的方向上最原始的初步步骤。


这是一个令人震惊的小世界,下面将进行介绍和描述。在 2000 年,


当他们回顾这个时代时,他们会想知道为什么直到 1960 年才有人开始在这个方向上认真行动。


为什么我们不能把《大英百科全书》的全部 24 卷写在一个针尖上?

 理查德·P·费曼

底部有很多空间,美国物理学会加州理工学院,1959 年 12 月 29 日

从时间隧道的这一端回望,费曼能够在许多年前预示量子技术的前景,令人感到同样的“惊奇”。


在我们对物理和生物现象的深入理解的追求中,也许现在我们才认真进入量子力学的“微观”世界的控制。这个世界的规则预示着新型材料和设备的出现[1-3]。


量子信息系统和测量仪器相比于经典对应物,承诺在速度和/或分辨率上实现指数级的提升。


许多这些系统在正常运行中本质上依赖于估计和控制,例如原子钟、测量电气、热量和光子特性、生物识别、磁力测量、重力测量以及许多提议的量子计算机实现。


仪器噪声、去相干和建模误差都是不确定性的来源,这些因素单独或结合在一起都会妨碍材料或设备满足性能要求的能力。


这些系统中的一些需要估计以确定系统是否满足性能要求,然后应用适应于特定估计误差的控制,例如 [ 4 8 ] [ 4 8 ] [4-8][4-8]

我们的目标是展示如何将估计和控制应用于量子系统。此外,我们相信,经过适当修改和开发的控制工程工具,是实现许多对量子技术的希望和梦想的手段。


31.1.1 量子估计与控制


“观察就是干扰”,这句格言如此说。那么,如何在量子力学中估计任何事物呢?答案是,尽管系统的行为遵循概率规则,但这些规则就是规则!因此,结果的概率就是定律。


因此,统计估计方法,如最大似然估计(ML)、最小二乘法、滤波等,确实适用。此外,量子系统的基本统计行为可以通过反馈进行控制。

在《人类对人类的使用:控制论与社会》(1950 年)中,诺伯特·维纳以这种方式介绍了反馈控制:

“This control of a machine on the basis of its actual performance, rather than its expected performance is known as feedback . . It is the function of control . . . to produce a temporary and local reversal of the normal direction of entropy.”
“这种基于机器实际性能而非预期性能的控制被称为反馈……控制的功能……是产生熵的正常方向的暂时和局部逆转。”
The classic classroom example of feedback control is the mechanical governor used by James Watt in the eighteenth century to regulate the speed of his steam engines (Figure 31.1).
经典的课堂反馈控制示例是詹姆斯·瓦特在十八世纪使用的机械调速器,用于调节他的蒸汽机的速度(图 31.1)。
The actual engine speed raises the balls by centrifugal force. As these rise, the linkages are arranged to close down the intake valve. The speed is maintained in the neighborhood of an equilibrium.
实际发动机转速通过离心力抬起球体。当球体上升时,连杆被安排关闭进气阀。转速保持在平衡附近。

Feedback control was essential for the stable operation of steam engines, and was thus a critical enabling technology for these machines which powered the industrial revolution. A precise analysis was not made until the mid-1800s when Clerk Maxwell put his mind to it.
反馈控制对于蒸汽机的稳定运行至关重要,因此成为了推动工业革命的这些机器的关键技术。直到 19 世纪中叶,克拉克·麦克斯韦才对此进行了精确分析。
What is it that is so compelling about this apparatus? Firstly, it is easy to understand how it regulates the speed of a rotating steam engine. Secondly, and perhaps more importantly, it is a part of the device itself.
这个装置有什么如此吸引人的地方?首先,很容易理解它是如何调节旋转蒸汽机的速度的。其次,也许更重要的是,它是设备本身的一部分。

A naive observer would not distinguish this mechanical piece from the rest. And this device, if we think of it having a thought, almost needs no thoughts at all!
一个天真的观察者不会将这个机械部件与其他部件区分开来。而这个装置,如果我们认为它有思想,几乎不需要任何思想!

It need not know any real detail about the object it controls; no knowledge of steam, pressure, flow, friction, metal fatigue, anchor bolt placement, and so on. Almost nothing. Yet, it is the fundamental piece without which the steam engine might explode. Due
它不需要了解它控制的对象的任何真实细节;不需要了解蒸汽、压力、流量、摩擦、金属疲劳、锚栓位置等等。几乎什么都不需要。然而,它是蒸汽机的基本组成部分,没有它,蒸汽机可能会爆炸。
FIGURE 31.1 Boulton and Watt steam engine, 1788, showing the mechanical governor (metal ball mechanism) [located at London Science Museum].
图 31.1 博尔顿和瓦特蒸汽机,1788 年,显示机械调速器(金属球机制)[位于伦敦科学博物馆]。

to its seeming simplicity, the notion of feedback takes on a mysterious property. It is both intangible, and yet, fundamental to the stability of the device, because it responds to the effect of the actual rotational speed.
尽管反馈的概念看似简单,但它却具有神秘的特性。它既是无形的,又是设备稳定性的基础,因为它对实际转速的影响作出反应。

Without this simultaneously intangible and real feedback, the device would not exist!
没有这种同时无形又真实的反馈,这个设备就不存在!
Steam engines, are of course macroscopic systems described by classical physics, and control engineering has been founded on classical models. At this point in time, it is beginning to be possible to monitor and manipulate objects at the nanoscale.
蒸汽机当然是由经典物理描述的宏观系统,控制工程是建立在经典模型基础上的。此时,监测和操控纳米尺度的物体开始变得可能。

One can realistically contemplate controlling single atoms (Figure 31.2).
人们可以现实地考虑控制单个原子(图 31.2)。
At the atomic scale, the laws of quantum physics are needed, and in fact provide a significant new resource for technological exploitation, as can be seen in recent advances in quantum information and computing, precise metrology, atom lasers, quantum electromechanical systems, and quantum chemistry.
在原子尺度上,需要量子物理的法则,实际上为技术开发提供了重要的新资源,这在量子信息与计算、精密计量、原子激光、量子机电系统和量子化学的最新进展中得到了体现。

Quantum control refers to the control of physical systems whose behavior is dominated by the laws of quantum physics, and control theory is being developed that takes into account quantum physics (e.g., [ 9 41 ] [ 9 41 ] [9-41][9-41] ).
量子控制是指对物理系统的控制,这些系统的行为受量子物理法则的主导,正在开发考虑量子物理的控制理论(例如, [ 9 41 ] [ 9 41 ] [9-41][9-41] )。
What types of quantum control can be envisaged? As for classical (i.e., nonquantum) systems, we distinguish between open- and closed-loop control.
可以设想哪些类型的量子控制?对于经典(即非量子)系统,我们区分开环控制和闭环控制。

Open-loop control has its usual meaning-a predetermined classical control signal is applied to the plant, in this case a quantum system, and no feedback is involved (Figure 31.3).
开环控制具有其通常的含义——一个预定的经典控制信号被施加到系统中,在这种情况下是量子系统,并且不涉及反馈(图 31.3)。
Closed-loop or feedback control also has its usual meaning-control actions depend on information gained while the plant is operating-however, care must be taken as to the nature of the controller
闭环或反馈控制也有其通常的含义——控制动作依赖于在工厂运行时获得的信息——然而,必须注意控制器的性质
FIGURE 31.2 Model of an atom.
图 31.2 原子的模型。
FIGURE 31.3 Open-loop control.
图 31.3 开环控制。
FIGURE 31.4 Closed-loop measurement feedback control.
图 31.4 闭环测量反馈控制。

and what is meant by “information.” When the controller is a classical system, which can only process classical information, some form of measurement of the quantum plant is needed, see Figure 31.4. This is called measurement feedback quantum control.
当控制器是一个经典系统,只能处理经典信息时,需要对量子植物进行某种形式的测量,见图 31.4。这被称为测量反馈量子控制。

The theory and applications that have been developed for measurement feedback depend on quantum filtering theory [42,43], as we explain in Sections 31.5.2 through 31.5.4. Measurement feedback quantum control can be effective for a wide range of applications, and has the benefit that the control algorithms can be implemented in conventional classical hardware (provided it is fast enough).
测量反馈的理论和应用依赖于量子滤波理论[42,43],正如我们在 31.5.2 至 31.5.4 节中所解释的。测量反馈量子控制在广泛的应用中都可以有效,并且其优点在于控制算法可以在常规经典硬件中实现(前提是其速度足够快)。
It is also possible to use another quantum system as the controller, see Figure 31.5. This type of feedback does not use measurement, and the information flowing in the loop is fully quantum.
也可以使用另一个量子系统作为控制器,见图 31.5。这种反馈不使用测量,环路中流动的信息完全是量子信息。

This exchange of quantum information may be directional, via a quantum signal (such as a beam of light), or bidirectional, via a direct physical coupling. This is called coherent or quantum feedback quantum control.
这种量子信息的交换可能是单向的,通过量子信号(例如光束),或是双向的,通过直接的物理耦合。这被称为相干或量子反馈量子控制。

While quantum feedback is conceptually simple, at present little is known about how to systematically design fully ( CF ) coherent feedback loops. In Section 31.5.5, we describe one recent example of coherent feedback design.
尽管量子反馈在概念上很简单,但目前对如何系统地设计完全(CF)相干反馈回路知之甚少。在第 31.5.5 节中,我们描述了一个最近的相干反馈设计示例。

The benefits of coherent feedback include the preservation of quantum information, and that the timescales of the controller can be better matched to the quantum plant (which could have very fast dynamics).
一致反馈的好处包括量子信息的保存,以及控制器的时间尺度可以更好地与量子系统(可能具有非常快的动态)匹配。
FIGURE 31.5 Closed-loop feedback control with no measurement.
图 31.5 无测量的闭环反馈控制。

31.2 Some Quantum Mechanics
31.2 一些量子力学

31.2.1 Preliminaries 31.2.1 初步准备

Let H H H\mathcal{H} be a separable Hilbert space with inner product , , (:*,*:)\langle\cdot, \cdot\rangle (taken to be linear in the second argument and conjugate linear in the first) and norm ψ = ψ , ψ ψ = ψ , ψ ||psi||=sqrt((:psi,psi:))\|\psi\|=\sqrt{\langle\psi, \psi\rangle}. Basic examples are (i) H = C n H = C n H=C^(n)\mathcal{H}=\mathbb{C}^{n}, the space of n n nn-dimensional complex vectors, where ψ , ϕ = k = 1 n ψ k ϕ k ψ , ϕ = k = 1 n ψ k ϕ k (:psi,phi:)=sum_(k=1)^(n)psi_(k)^(†)phi_(k)\langle\psi, \phi\rangle=\sum_{k=1}^{n} \psi_{k}^{\dagger} \phi_{k}, where ψ k ψ k psi_(k)^(†)\psi_{k}^{\dagger} denotes the adjoint (complex conjugate) of ψ k ψ k psi_(k)\psi_{k}, and (ii) H = L 2 ( R ) H = L 2 ( R ) H=L^(2)(R)\mathcal{H}=L^{2}(\mathbb{R}), the space of complex-valued functions on R R R\mathbb{R} that have square integrable components, with inner product ψ , ϕ = ψ ( x ) ϕ ( x ) d x ψ , ϕ = ψ ( x ) ϕ ( x ) d x (:psi,phi:)=intpsi^(†)(x)phi(x)dx\langle\psi, \phi\rangle=\int \psi^{\dagger}(x) \phi(x) d x.
H H H\mathcal{H} 是一个可分的希尔伯特空间,内积为 , , (:*,*:)\langle\cdot, \cdot\rangle (在第二个参数上取线性,在第一个参数上取共轭线性),范数为 ψ = ψ , ψ ψ = ψ , ψ ||psi||=sqrt((:psi,psi:))\|\psi\|=\sqrt{\langle\psi, \psi\rangle} 。基本例子有(i) H = C n H = C n H=C^(n)\mathcal{H}=\mathbb{C}^{n} ,即 n n nn 维复向量空间,其中 ψ , ϕ = k = 1 n ψ k ϕ k ψ , ϕ = k = 1 n ψ k ϕ k (:psi,phi:)=sum_(k=1)^(n)psi_(k)^(†)phi_(k)\langle\psi, \phi\rangle=\sum_{k=1}^{n} \psi_{k}^{\dagger} \phi_{k} ψ k ψ k psi_(k)^(†)\psi_{k}^{\dagger} 表示 ψ k ψ k psi_(k)\psi_{k} 的伴随(复共轭),以及(ii) H = L 2 ( R ) H = L 2 ( R ) H=L^(2)(R)\mathcal{H}=L^{2}(\mathbb{R}) ,即在 R R R\mathbb{R} 上具有平方可积分量的复值函数空间,内积为 ψ , ϕ = ψ ( x ) ϕ ( x ) d x ψ , ϕ = ψ ( x ) ϕ ( x ) d x (:psi,phi:)=intpsi^(†)(x)phi(x)dx\langle\psi, \phi\rangle=\int \psi^{\dagger}(x) \phi(x) d x
Let B ( H ) B ( H ) B(H)\mathscr{B}(\mathcal{H}) be the Banach space of bounded operators A : H H A : H H A:HrarrHA: \mathcal{H} \rightarrow \mathcal{H}. The commutator of two operators is defined by [ A , B ] = A B B A [ A , B ] = A B B A [A,B]=AB-BA[A, B]=A B-B A. For any A B ( H ) A B ( H ) A inB(H)A \in \mathscr{B}(\mathcal{H}), its adjoint A B ( H ) A B ( H ) A^(†)inB(H)A^{\dagger} \in \mathscr{B}(\mathcal{H}) is an operator defined by A ψ , ϕ = ψ , A ϕ A ψ , ϕ = ψ , A ϕ (:A^(†)psi,phi:)=(:psi,A phi:)\left\langle A^{\dagger} \psi, \phi\right\rangle=\langle\psi, A \phi\rangle for all ψ , ϕ H ψ , ϕ H psi,phi inH\psi, \phi \in \mathcal{H}. An operator A B ( H ) A B ( H ) A inB(H)A \in \mathscr{B}(\mathcal{H}) is called normal if A A = A A A A = A A AA^(†)=A^(†)AA A^{\dagger}=A^{\dagger} A. Two important types of normal operators are self-adjoint ( A = A ) A = A (A=A^(†))\left(A=A^{\dagger}\right) and unitary ( A = A 1 ) A = A 1 (A^(†)=A^(-1))\left(A^{\dagger}=A^{-1}\right). The spectral theorem for a normal operator A A AA says that (discrete case) there exists a complete set of orthonormal eigenvectors (such a set forms a basis for H H H\mathcal{H} ), and A A AA can be written as A = n a n P n A = n a n P n A=sum_(n)a_(n)P_(n)A=\sum_{n} a_{n} P_{n}, where P n P n P_(n)P_{n} is the projection onto the n n nnth eigenspace (diagonal representation) with associated eigenvalue a n a n a_(n)a_{n}. In Dirac’s bra-ket notation, the eigenvectors are written | n | n |n:)|n\rangle and the projections P n = | n n | P n = | n n | P_(n)=|n:)(:n|P_{n}=|n\rangle\langle n|. The projections resolve the identity (orthogonally): n P n = I n P n = I sum_(n)P_(n)=I\sum_{n} P_{n}=I. If A A AA is self-adjoint, the eigenvalues a n a n a_(n)a_{n} are all real. In this notation, most often written by physicists, the “ket” | ψ | ψ |psi:)|\psi\rangle is always a unit vector with adjoint ψ | ψ | (:psi|\langle\psi|. The norm of | ψ | ψ |psi:)|\psi\rangle is thus ψ = ψ ψ = 1 ψ = ψ ψ = 1 ||psi||=sqrt((:psi∣psi:))=1\|\psi\|=\sqrt{\langle\psi \mid \psi\rangle}=1. (We will not always adhere to the ket-notation, and so sometimes write ψ ψ psi\psi and implicitly assume that it is a unit vector, i.e., ψ ψ = 1 ψ ψ = 1 psi^(†)psi=1\psi^{\dagger} \psi=1.)
B ( H ) B ( H ) B(H)\mathscr{B}(\mathcal{H}) 成为有界算子的巴拿赫空间 A : H H A : H H A:HrarrHA: \mathcal{H} \rightarrow \mathcal{H} 。两个算子的对易子由 [ A , B ] = A B B A [ A , B ] = A B B A [A,B]=AB-BA[A, B]=A B-B A 定义。对于任何 A B ( H ) A B ( H ) A inB(H)A \in \mathscr{B}(\mathcal{H}) ,其伴随算子 A B ( H ) A B ( H ) A^(†)inB(H)A^{\dagger} \in \mathscr{B}(\mathcal{H}) 是由 A ψ , ϕ = ψ , A ϕ A ψ , ϕ = ψ , A ϕ (:A^(†)psi,phi:)=(:psi,A phi:)\left\langle A^{\dagger} \psi, \phi\right\rangle=\langle\psi, A \phi\rangle 定义的,适用于所有 ψ , ϕ H ψ , ϕ H psi,phi inH\psi, \phi \in \mathcal{H} 。如果算子 A B ( H ) A B ( H ) A inB(H)A \in \mathscr{B}(\mathcal{H}) 满足 A A = A A A A = A A AA^(†)=A^(†)AA A^{\dagger}=A^{\dagger} A ,则称其为正常算子。两种重要的正常算子是自伴随算子 ( A = A ) A = A (A=A^(†))\left(A=A^{\dagger}\right) 和单位算子 ( A = A 1 ) A = A 1 (A^(†)=A^(-1))\left(A^{\dagger}=A^{-1}\right) 。正常算子 A A AA 的谱定理表明(离散情况)存在一组完整的正交归一特征向量(这样的集合构成 H H H\mathcal{H} 的基),并且 A A AA 可以写成 A = n a n P n A = n a n P n A=sum_(n)a_(n)P_(n)A=\sum_{n} a_{n} P_{n} ,其中 P n P n P_(n)P_{n} 是投影到第 n n nn 个特征空间(对角表示),其相关特征值为 a n a n a_(n)a_{n} 。在迪拉克的布拉-凯特符号中,特征向量写作 | n | n |n:)|n\rangle ,投影写作 P n = | n n | P n = | n n | P_(n)=|n:)(:n|P_{n}=|n\rangle\langle n| 。这些投影正交地分解单位元: n P n = I n P n = I sum_(n)P_(n)=I\sum_{n} P_{n}=I 。如果 A A AA 是自伴随的,则特征值 a n a n a_(n)a_{n} 全部为实数。在这种符号中,物理学家通常写作的“凯特” | ψ | ψ |psi:)|\psi\rangle 始终是伴随 ψ | ψ | (:psi|\langle\psi| 的单位向量。因此, | ψ | ψ |psi:)|\psi\rangle 的范数为 ψ = ψ ψ = 1 ψ = ψ ψ = 1 ||psi||=sqrt((:psi∣psi:))=1\|\psi\|=\sqrt{\langle\psi \mid \psi\rangle}=1 。(我们并不总是遵循凯特符号,有时写作 ψ ψ psi\psi 并隐含假设它是单位向量,即 ψ ψ = 1 ψ ψ = 1 psi^(†)psi=1\psi^{\dagger} \psi=1 。)
Tensor products are used to describe composite systems. If H 1 H 1 H_(1)\mathcal{H}_{1} and H 2 H 2 H_(2)\mathcal{H}_{2} are Hilbert spaces, the tensor product H 1 H 2 H 1 H 2 H_(1)oxH_(2)\mathcal{H}_{1} \otimes \mathcal{H}_{2} is the Hilbert space consisting of linear combinations of the form ψ 1 ψ 2 ψ 1 ψ 2 psi_(1)oxpsi_(2)\psi_{1} \otimes \psi_{2}, and inner product ψ 1 ψ 2 , ϕ 1 ϕ 2 = ψ 1 , ϕ 1 ψ 2 , ϕ 2 ψ 1 ψ 2 , ϕ 1 ϕ 2 = ψ 1 , ϕ 1 ψ 2 , ϕ 2 (:psi_(1)oxpsi_(2),phi_(1)oxphi_(2):)=(:psi_(1),phi_(1):)(:psi_(2),phi_(2):)\left\langle\psi_{1} \otimes \psi_{2}, \phi_{1} \otimes \phi_{2}\right\rangle=\left\langle\psi_{1}, \phi_{1}\right\rangle\left\langle\psi_{2}, \phi_{2}\right\rangle. Here, ψ 1 , ϕ 1 H 1 ψ 1 , ϕ 1 H 1 psi_(1),phi_(1)inH_(1)\psi_{1}, \phi_{1} \in \mathcal{H}_{1} and ψ 2 , ϕ 2 H 2 ψ 2 , ϕ 2 H 2 psi_(2),phi_(2)inH_(2)\psi_{2}, \phi_{2} \in \mathcal{H}_{2}. If A 1 A 1 A_(1)A_{1} and A 2 A 2 A_(2)A_{2} are operators on H 1 H 1 H_(1)\mathcal{H}_{1} and H 2 H 2 H_(2)\mathcal{H}_{2}, respectively, then A 1 A 2 A 1 A 2 A_(1)oxA_(2)A_{1} \otimes A_{2} is an operator on H 1 H 2 H 1 H 2 H_(1)oxH_(2)\mathcal{H}_{1} \otimes \mathcal{H}_{2} and is defined by ( A 1 A 2 ) ( ψ 1 ψ 2 ) = A 1 ψ 1 A 2 ψ 2 A 1 A 2 ψ 1 ψ 2 = A 1 ψ 1 A 2 ψ 2 (A_(1)oxA_(2))(psi_(1)oxpsi_(2))=A_(1)psi_(1)oxA_(2)psi_(2)\left(A_{1} \otimes A_{2}\right)\left(\psi_{1} \otimes \psi_{2}\right)=A_{1} \psi_{1} \otimes A_{2} \psi_{2}. Often, A 1 A 2 A 1 A 2 A_(1)oxA_(2)A_{1} \otimes A_{2} is written A 1 A 2 A 1 A 2 A_(1)A_(2)A_{1} A_{2}.
张量积用于描述复合系统。如果 H 1 H 1 H_(1)\mathcal{H}_{1} H 2 H 2 H_(2)\mathcal{H}_{2} 是希尔伯特空间,则张量积 H 1 H 2 H 1 H 2 H_(1)oxH_(2)\mathcal{H}_{1} \otimes \mathcal{H}_{2} 是由形式为 ψ 1 ψ 2 ψ 1 ψ 2 psi_(1)oxpsi_(2)\psi_{1} \otimes \psi_{2} 的线性组合构成的希尔伯特空间,内积为 ψ 1 ψ 2 , ϕ 1 ϕ 2 = ψ 1 , ϕ 1 ψ 2 , ϕ 2 ψ 1 ψ 2 , ϕ 1 ϕ 2 = ψ 1 , ϕ 1 ψ 2 , ϕ 2 (:psi_(1)oxpsi_(2),phi_(1)oxphi_(2):)=(:psi_(1),phi_(1):)(:psi_(2),phi_(2):)\left\langle\psi_{1} \otimes \psi_{2}, \phi_{1} \otimes \phi_{2}\right\rangle=\left\langle\psi_{1}, \phi_{1}\right\rangle\left\langle\psi_{2}, \phi_{2}\right\rangle 。这里, ψ 1 , ϕ 1 H 1 ψ 1 , ϕ 1 H 1 psi_(1),phi_(1)inH_(1)\psi_{1}, \phi_{1} \in \mathcal{H}_{1} ψ 2 , ϕ 2 H 2 ψ 2 , ϕ 2 H 2 psi_(2),phi_(2)inH_(2)\psi_{2}, \phi_{2} \in \mathcal{H}_{2} 。如果 A 1 A 1 A_(1)A_{1} A 2 A 2 A_(2)A_{2} 分别是作用于 H 1 H 1 H_(1)\mathcal{H}_{1} H 2 H 2 H_(2)\mathcal{H}_{2} 的算子,则 A 1 A 2 A 1 A 2 A_(1)oxA_(2)A_{1} \otimes A_{2} 是作用于 H 1 H 2 H 1 H 2 H_(1)oxH_(2)\mathcal{H}_{1} \otimes \mathcal{H}_{2} 的算子,定义为 ( A 1 A 2 ) ( ψ 1 ψ 2 ) = A 1 ψ 1 A 2 ψ 2 A 1 A 2 ψ 1 ψ 2 = A 1 ψ 1 A 2 ψ 2 (A_(1)oxA_(2))(psi_(1)oxpsi_(2))=A_(1)psi_(1)oxA_(2)psi_(2)\left(A_{1} \otimes A_{2}\right)\left(\psi_{1} \otimes \psi_{2}\right)=A_{1} \psi_{1} \otimes A_{2} \psi_{2} 。通常, A 1 A 2 A 1 A 2 A_(1)oxA_(2)A_{1} \otimes A_{2} 写作 A 1 A 2 A 1 A 2 A_(1)A_(2)A_{1} A_{2}

31.2.2 The Postulates of Quantum Mechanics
31.2.2 量子力学的公设

In quantum mechanics [44] physical quantities like energy, spin, position, and so on, are expressed as observables; these are represented as self-adjoint operators ( A = A ) A = A (A=A^(†))\left(A=A^{\dagger}\right) acting on a Hilbert space H H H\mathcal{H}.
在量子力学中,能量、自旋、位置等物理量被表示为可观测量;这些量被表示为作用在希尔伯特空间上的自伴算符。
The state of a quantum system is a unit vector ψ H ψ H psi inH\psi \in \mathcal{H} or | ψ H | ψ H |psi:)inH|\psi\rangle \in \mathcal{H}. In the discrete case every element ψ k ψ k psi_(k)\psi_{k} is a possible state of the system with a probability of occurence | ψ k | 2 ψ k 2 |psi_(k)|^(2)\left|\psi_{k}\right|^{2}. Hence, ψ = 1 ψ = 1 ||psi||=1\|\psi\|=1 means that all outcomes can occur. (The same applies in the continuous case, for example, at a spatial point r = ( x , y , z ) r = ( x , y , z ) r=(x,y,z)r=(x, y, z), ψ ( r ) 2 d x d y d z ψ ( r ) 2 d x d y d z ||psi(r)||^(2)dxdydz\|\psi(r)\|^{2} d x d y d z is the probability that a particle would be found in the differential volume.) The state | ψ | ψ |psi:)|\psi\rangle is called a pure state. Pure states are special cases of a more general notion of state referred to as a density operator or density matrix. A density operator ρ ρ rho\rho is a positive self-adjoint operator on H H H\mathcal{H} with trace one. Pure states are of the form ρ = | ψ ψ | ρ = | ψ ψ | rho=|psi:)(:psi|\rho=|\psi\rangle\langle\psi|. More generally, states that are convex combinations of pure states are called mixed states: ρ = n λ n | ψ n ψ n | ρ = n λ n ψ n ψ n rho=sum_(n)lambda_(n)|psi_(n):)(:psi_(n)|\rho=\sum_{n} \lambda_{n}\left|\psi_{n}\right\rangle\left\langle\psi_{n}\right|.
量子系统的状态是单位向量 ψ H ψ H psi inH\psi \in \mathcal{H} | ψ H | ψ H |psi:)inH|\psi\rangle \in \mathcal{H} 。在离散情况下,每个元素 ψ k ψ k psi_(k)\psi_{k} 都是系统的一个可能状态,发生的概率为 | ψ k | 2 ψ k 2 |psi_(k)|^(2)\left|\psi_{k}\right|^{2} 。因此, ψ = 1 ψ = 1 ||psi||=1\|\psi\|=1 意味着所有结果都可以发生。(在连续情况下也是如此,例如,在空间点 r = ( x , y , z ) r = ( x , y , z ) r=(x,y,z)r=(x, y, z) ψ ( r ) 2 d x d y d z ψ ( r ) 2 d x d y d z ||psi(r)||^(2)dxdydz\|\psi(r)\|^{2} d x d y d z 是粒子在微分体积中被发现的概率。)状态 | ψ | ψ |psi:)|\psi\rangle 称为纯态。纯态是更一般的状态概念的特例,称为密度算子或密度矩阵。密度算子 ρ ρ rho\rho 是在 H H H\mathcal{H} 上的正自伴算子,迹为一。纯态的形式为 ρ = | ψ ψ | ρ = | ψ ψ | rho=|psi:)(:psi|\rho=|\psi\rangle\langle\psi| 。更一般地,纯态的凸组合称为混合态: ρ = n λ n | ψ n ψ n | ρ = n λ n ψ n ψ n rho=sum_(n)lambda_(n)|psi_(n):)(:psi_(n)|\rho=\sum_{n} \lambda_{n}\left|\psi_{n}\right\rangle\left\langle\psi_{n}\right|
The postulates of quantum mechanics state that for a closed system the evolution of states obeys the Schrödinger equation
量子力学的公设指出,对于一个封闭系统,状态的演化遵循薛定谔方程
i d d t | ψ = H | ψ i d d t | ψ = H | ψ i(d)/(dt)|psi:)=H|psi:)i \frac{d}{d t}|\psi\rangle=H|\psi\rangle
Here, H H HH is an observable called the Hamiltonian, and represents the energy of the system, and i = 1 i = 1 i=sqrt(-1)i=\sqrt{-1}. Since | ψ ( t ) | ψ ( t ) |psi(t):)|\psi(t)\rangle has unit norm, the evolution from one time to another must be unitary, that is, ψ ( t ) = ψ ( t ) = psi(t)=\psi(t)= U ( t ) ψ ( 0 ) U ( t ) ψ ( 0 ) U(t)psi(0)U(t) \psi(0) where the unitary transition matrix, referred to as the propagator, obeys a matrix version of the Schrödinger equation, i U ˙ = H U , U ( 0 ) = I i U ˙ = H U , U ( 0 ) = I iU^(˙)=HU,U(0)=Ii \dot{U}=H U, U(0)=I (the identity). Density operators also evolve unitarily, ρ ( t ) = U ( t ) ρ U ( t ) ρ ( t ) = U ( t ) ρ U ( t ) rho(t)=U(t)rhoU^(†)(t)\rho(t)=U(t) \rho U^{\dagger}(t), so, by the Schrödinger equation (31.1) we have i ρ ˙ = [ H , ρ ] = H ρ ρ H i ρ ˙ = [ H , ρ ] = H ρ ρ H irho^(˙)=[H,rho]=H rho-rho Hi \dot{\rho}=[H, \rho]=H \rho-\rho H. We may view state vectors as fixed in time, while observables are taken to evolve according to A ( t ) = U ( t ) A U ( t ) A ( t ) = U ( t ) A U ( t ) A(t)=U^(†)(t)AU(t)A(t)=U^{\dagger}(t) A U(t) : this is the Heisenberg picture.
在这里, H H HH 是一个称为哈密顿量的可观测量,代表系统的能量,以及 i = 1 i = 1 i=sqrt(-1)i=\sqrt{-1} 。由于 | ψ ( t ) | ψ ( t ) |psi(t):)|\psi(t)\rangle 具有单位范数,从一个时间到另一个时间的演化必须是单位的,即 ψ ( t ) = ψ ( t ) = psi(t)=\psi(t)= U ( t ) ψ ( 0 ) U ( t ) ψ ( 0 ) U(t)psi(0)U(t) \psi(0) ,其中称为传播算子的单位转移矩阵遵循薛定谔方程的矩阵版本, i U ˙ = H U , U ( 0 ) = I i U ˙ = H U , U ( 0 ) = I iU^(˙)=HU,U(0)=Ii \dot{U}=H U, U(0)=I (单位矩阵)。密度算子也以单位方式演化, ρ ( t ) = U ( t ) ρ U ( t ) ρ ( t ) = U ( t ) ρ U ( t ) rho(t)=U(t)rhoU^(†)(t)\rho(t)=U(t) \rho U^{\dagger}(t) ,因此,根据薛定谔方程(31.1),我们有 i ρ ˙ = [ H , ρ ] = H ρ ρ H i ρ ˙ = [ H , ρ ] = H ρ ρ H irho^(˙)=[H,rho]=H rho-rho Hi \dot{\rho}=[H, \rho]=H \rho-\rho H 。我们可以将状态向量视为固定在时间上,而可观测量则根据 A ( t ) = U ( t ) A U ( t ) A ( t ) = U ( t ) A U ( t ) A(t)=U^(†)(t)AU(t)A(t)=U^{\dagger}(t) A U(t) 演化:这就是海森堡图像。
The numerical value of a measurement of A A AA is an eigenvalue of A A AA. If the system is in state ρ ρ rho\rho at the time of the measurement, and A A AA has the spectral decomposition A = n a n P n A = n a n P n A=sum_(n)a_(n)P_(n)A=\sum_{n} a_{n} P_{n}, the value a n a n a_(n)a_{n} occurs with probability
测量 A A AA 的数值是 A A AA 的特征值。如果系统在测量时处于状态 ρ ρ rho\rho ,并且 A A AA 具有谱分解 A = n a n P n A = n a n P n A=sum_(n)a_(n)P_(n)A=\sum_{n} a_{n} P_{n} ,则值 a n a n a_(n)a_{n} 以概率出现。
Prob ( a n ) = Tr [ ρ P n ] Prob a n = Tr ρ P n Prob(a_(n))=Tr[rhoP_(n)]\operatorname{Prob}\left(a_{n}\right)=\operatorname{Tr}\left[\rho P_{n}\right]
After the measurement, if the value a n a n a_(n)a_{n} is recorded, the state “collapses” to
测量后,如果记录的值为 a n a n a_(n)a_{n} ,状态“塌缩”为
ρ = P n ρ P n Prob ( a n ) ρ = P n ρ P n Prob a n rho^(')=(P_(n)rhoP_(n))/(Prob(a_(n)))\rho^{\prime}=\frac{P_{n} \rho P_{n}}{\operatorname{Prob}\left(a_{n}\right)}
This is Von Neumann’s state reduction. When a quantum system is in a pure state | ψ | ψ |psi:)|\psi\rangle, the expected value of an observable A A AA is defined in terms of the Hilbert space inner product: A = ψ , A ψ A = ψ , A ψ (:A:)=(:psi,A psi:)\langle A\rangle=\langle\psi, A \psi\rangle. Using the spectral decomposition of A A AA gives A = n λ n ψ , P n ψ A = n λ n ψ , P n ψ (:A:)=sum_(n)lambda_(n)(:psi,P_(n)psi:)\langle A\rangle=\sum_{n} \lambda_{n}\left\langle\psi, P_{n} \psi\right\rangle. If the system is in the mixed state ρ ρ rho\rho, then A = Tr ( A ρ ) = n λ n Tr ( P n ρ ) A = Tr ( A ρ ) = n λ n Tr P n ρ (:A:)=Tr(A rho)=sum_(n)lambda_(n)Tr(P_(n)rho)\langle A\rangle=\operatorname{Tr}(A \rho)=\sum_{n} \lambda_{n} \operatorname{Tr}\left(P_{n} \rho\right). (We will use the notations A A (:A:)\langle A\rangle or P [ A ] P [ A ] P[A]\mathbb{P}[A] for the expected value of an observable A.)
这是冯·诺依曼的状态简化。当量子系统处于纯态 | ψ | ψ |psi:)|\psi\rangle 时,可观测量 A A AA 的期望值通过希尔伯特空间内积定义为 A = ψ , A ψ A = ψ , A ψ (:A:)=(:psi,A psi:)\langle A\rangle=\langle\psi, A \psi\rangle 。使用 A A AA 的谱分解得到 A = n λ n ψ , P n ψ A = n λ n ψ , P n ψ (:A:)=sum_(n)lambda_(n)(:psi,P_(n)psi:)\langle A\rangle=\sum_{n} \lambda_{n}\left\langle\psi, P_{n} \psi\right\rangle 。如果系统处于混合态 ρ ρ rho\rho ,则 A = Tr ( A ρ ) = n λ n Tr ( P n ρ ) A = Tr ( A ρ ) = n λ n Tr P n ρ (:A:)=Tr(A rho)=sum_(n)lambda_(n)Tr(P_(n)rho)\langle A\rangle=\operatorname{Tr}(A \rho)=\sum_{n} \lambda_{n} \operatorname{Tr}\left(P_{n} \rho\right) 。(我们将使用符号 A A (:A:)\langle A\rangle P [ A ] P [ A ] P[A]\mathbb{P}[A] 表示可观测量 A 的期望值。)
In a more abstract mathematical sense, if C C C\mathscr{C} is a commutative collection of operators (a commutative *-algebra), then by the spectral theorem [13, Theorem 2.4] a density operator ρ ρ rho\rho determines a classical probability distribution P P P\mathbf{P} and for all C C C C C inCC \in \mathscr{C} a classical random variable ι ( C ) ι ( C ) iota(C)\iota(C) on a classical probability space constructed from the spectrum of C C C\mathscr{C} such that P [ C ] = P [ ι ( C ) ] P [ C ] = P [ ι ( C ) ] P[C]=P[iota(C)]\mathbb{P}[C]=\mathbf{P}[\iota(C)]. When the context is clear we may abuse the notation and simply write C C CC for both the observable C C C C C inCC \in \mathscr{C} or the corresponding classical random variable ι ( C ) ι ( C ) iota(C)\iota(C). In case of the postulate stated above for an observable A A AA, the projections P n P n P_(n)P_{n} generate such a commutative collection C C C\mathscr{C}.
在更抽象的数学意义上,如果 C C C\mathscr{C} 是一个可交换的算子集合(一个可交换的*-代数),那么根据谱定理[13,定理 2.4],一个密度算子 ρ ρ rho\rho 确定了一个经典概率分布 P P P\mathbf{P} ,并且对于所有 C C C C C inCC \in \mathscr{C} ,在由 C C C\mathscr{C} 的谱构造的经典概率空间上有一个经典随机变量 ι ( C ) ι ( C ) iota(C)\iota(C) ,使得 P [ C ] = P [ ι ( C ) ] P [ C ] = P [ ι ( C ) ] P[C]=P[iota(C)]\mathbb{P}[C]=\mathbf{P}[\iota(C)] 。当上下文清晰时,我们可以滥用符号,简单地用 C C CC 表示可观测量 C C C C C inCC \in \mathscr{C} 或相应的经典随机变量 ι ( C ) ι ( C ) iota(C)\iota(C) 。在上述可观测量 A A AA 的公设情况下,投影 P n P n P_(n)P_{n} 生成这样一个可交换集合 C C C\mathscr{C}

31.2.3 Open Quantum Systems
31.2.3 开放量子系统

Open quantum systems are quantum systems that form part of a larger closed system. Figure 31.6 illustrates a representation of a system S S SS which is “open” to the environment E E EE. The environment consists
开放量子系统是构成更大封闭系统一部分的量子系统。图 31.6 展示了一个“开放”于环境的系统 S S SS 的表示。环境由以下组成:
FIGURE 31.6 Representation of an open quantum system.
图 31.6 开放量子系统的表示。

of an inaccessible part of the whole system, for example, a heat bath, nuclear spins, phonons, and so on. The complete S E S E SES E system (a composite system) obeys the normal evolutionary dynamics of quantum mechanics as given by a unitary U S E U S E U_(SE)U_{S E}, which may depend on externally applied classical controls.
一个整体系统中不可接触的部分,例如热浴、核自旋、声子等。完整的 S E S E SES E 系统(复合系统)遵循量子力学的正常演化动态,由一个单位 U S E U S E U_(SE)U_{S E} 给出,该单位可能依赖于外部施加的经典控制。
Here the state of the S S SS-system is accessible, while the state of the E E EE-system is not accessible. We will refer to the S S SS-system as the system and the the E E EE-system as the environment or bath. Since not every state of the universe is accessible, it is of basic interest to describe the potentially nonunitary transformation of the system state from one time to another.
在这里, S S SS -系统的状态是可访问的,而 E E EE -系统的状态是不可访问的。我们将 S S SS -系统称为系统,将 E E EE -系统称为环境或浴。由于宇宙的每个状态并非都是可访问的,因此描述系统状态从一个时间到另一个时间的潜在非单位变换是基本的兴趣所在。

一般来说,任何开放量子系统的状态间动态可以用一种称为 Kraus 算子和表示(OSR)的规范形式来描述[45]。这种表述可以考虑多种形式的误差源以及去相干。设 ρ in S ρ in  S rho_("in ")^(S)\rho_{\text {in }}^{S} 表示某个初始时刻的系统状态, ρ out S ρ out  S rho_("out ")^(S)\rho_{\text {out }}^{S} 表示稍后的时刻。如果输入状态 ρ in S C n S × n S ρ in  S C n S × n S rho_("in ")^(S)inC^(n_(S)xxn_(S))\rho_{\text {in }}^{S} \in \mathbf{C}^{n_{S} \times n_{S}} ρ E C n E × n E ρ E C n E × n E rho^(E)inC^(n_(E)xxn_(E))\rho^{E} \in \mathbf{C}^{n_{E} \times n_{E}} 是无关的,即它们形成了对 U S E U S E U_(SE)U_{S E} 的张量积输入,那么在 S S SS -系统输出时的状态由 Kraus OSR 给出,
ρ out S = μ = 1 κ K μ ρ in S K μ , μ = 1 κ K μ K μ = I S ρ out  S = μ = 1 κ K μ ρ in  S K μ , μ = 1 κ K μ K μ = I S rho_("out ")^(S)=sum_(mu=1)^(kappa)K_(mu)rho_("in ")^(S)K_(mu)^(†),quadsum_(mu=1)^(kappa)K_(mu)^(†)K_(mu)=I_(S)\rho_{\text {out }}^{S}=\sum_{\mu=1}^{\kappa} K_{\mu} \rho_{\text {in }}^{S} K_{\mu}^{\dagger}, \quad \sum_{\mu=1}^{\kappa} K_{\mu}^{\dagger} K_{\mu}=I_{S}

K μ C n s × n s K μ C n s × n s K_(mu)inC^(ns xx ns)K_{\mu} \in \mathbf{C}^{n s \times n s} ,称为 OSR 元素,如上所述,确保量子系统保持迹,换句话说, Tr ρ in S = 1 Tr ρ in  S = 1 Trrho_("in ")^(S)=1\operatorname{Tr} \rho_{\text {in }}^{S}=1 意味着 Tr ρ out S = 1 Tr ρ out  S = 1 Trrho_("out ")^(S)=1\operatorname{Tr} \rho_{\text {out }}^{S}=1 。此外,对 S S SS -系统的测量产生的所有量子统计都被 OSR 捕获。具体来说,对于 S S SS -系统上的任何可观测量 A = n a n P n A = n a n P n A=sum_(n)a_(n)P_(n)A=\sum_{n} a_{n} P_{n}
Prob ( a n ) = Tr ( P n ρ out S ) = μ Tr ( P n K μ ρ in S K μ ) Prob a n = Tr P n ρ out  S = μ Tr P n K μ ρ in  S K μ Prob(a_(n))=Tr(P_(n)rho_("out ")^(S))=sum_(mu)Tr(P_(n)K_(mu)rho_("in ")^(S)K_(mu)^(†))\operatorname{Prob}\left(a_{n}\right)=\operatorname{Tr}\left(P_{n} \rho_{\text {out }}^{S}\right)=\sum_{\mu} \operatorname{Tr}\left(P_{n} K_{\mu} \rho_{\text {in }}^{S} K_{\mu}^{\dagger}\right)

输出状态是通过“追踪”环境状态获得的,称为部分迹运算,表示为
ρ out S = Tr E [ U S E ( ρ in S ρ E ) U S E ] ρ out  S = Tr E U S E ρ in  S ρ E U S E rho_("out ")^(S)=Tr_(E)[U_(SE)(rho_("in ")^(S)oxrho^(E))U_(SE)^(†)]\rho_{\text {out }}^{S}=\operatorname{Tr}_{E}\left[U_{S E}\left(\rho_{\text {in }}^{S} \otimes \rho^{E}\right) U_{S E}^{\dagger}\right]

开放系统的输出状态因此是单位动力学 U S E U S E U_(SE)U_{S E} E E EE -系统对 S S SS -系统的平均影响的结合[45]。

然而,在其他情况下, S S SS -系统的状态是不可获取的,而 E E EE -系统或 E E EE -系统的部分是可获取的,并可用于反馈控制。例如,在图 31.7 中, S S SS -系统是一个原子,而 E E EE -系统是外部自由移动的场。原子无法直接测量。相反,测量场的可观察量 y 0 ( t ) y 0 ( t ) y_(0)(t)y_{0}(t) ,并可以通过经典方式处理,并用于测量反馈控制,见第 31.5.3 节。或者,场不必被测量,而可以通过另一个量子系统进行相干处理,如在相干反馈控制中,见第 31.5.5 节。


31.2.4 凸性与量子力学


凸性在量子力学中非常自然地出现,并在量子估计中发挥着重要作用,许多问题可以被表述为凸优化。


考虑例如以下凸集,这些凸集源自量子力学在维度为 n n nn 的希尔伯特空间中的一些基本方面:

图 31.7 腔体中的原子反馈控制。在第 31.2.3 节的符号中,原子是 S S SS -系统,而场 b in ( t ) b in  ( t ) b_("in ")(t)b_{\text {in }}(t) b out ( t ) b out  ( t ) b_("out ")(t)b_{\text {out }}(t) 构成了 E E EE -系统。在这里, E E EE -系统的一个可观测量 y 0 ( t ) y 0 ( t ) y_(0)(t)y_{0}(t) 被测量并用于反馈回路。
 概率结果 { p α R } p α R {p_(alpha)inR}\left\{p_{\alpha} \in \mathbf{R}\right\} α p α = 1 , p α 0 α p α = 1 , p α 0 sum_(alpha)p_(alpha)=1,p_(alpha) >= 0\sum_{\alpha} p_{\alpha}=1, p_{\alpha} \geq 0
 密度矩阵 { ρ C n × n } ρ C n × n {rho inC^(n xx n)}\left\{\rho \in \mathbf{C}^{n \times n}\right\} Tr ρ = 1 , ρ 0 Tr ρ = 1 , ρ 0 Tr rho=1,rho >= 0\operatorname{Tr} \rho=1, \rho \geq 0

正算子值测度 (POVM)
{ O α C n × n } O α C n × n {O_(alpha)inC^(n xx n)}\left\{O_{\alpha} \in \mathbf{C}^{n \times n}\right\} α O α = I n , O α 0 α O α = I n , O α 0 sum_(alpha)O_(alpha)=I_(n),O_(alpha) >= 0\sum_{\alpha} O_{\alpha}=I_{n}, O_{\alpha} \geq 0

在固定基集中的 OSR
{ X C n 2 × n 2 } X C n 2 × n 2 {X inC^(n^(2)xxn^(2))}\left\{X \in \mathbf{C}^{n^{2} \times n^{2}}\right\} i j X i j B i B j = I n , X 0 i j X i j B i B j = I n , X 0 sum_(ij)X_(ij)B_(i)^(†)B_(j)=I_(n),X >= 0\sum_{i j} X_{i j} B_{i}^{\dagger} B_{j}=I_{n}, X \geq 0
Probability outcomes {p_(alpha)inR} sum_(alpha)p_(alpha)=1,p_(alpha) >= 0 Density matrix {rho inC^(n xx n)} Tr rho=1,rho >= 0 Positive operator valued measure (POVM) {O_(alpha)inC^(n xx n)} sum_(alpha)O_(alpha)=I_(n),O_(alpha) >= 0 OSR in a fixed basis set {X inC^(n^(2)xxn^(2))} sum_(ij)X_(ij)B_(i)^(†)B_(j)=I_(n),X >= 0| Probability outcomes | $\left\{p_{\alpha} \in \mathbf{R}\right\}$ | $\sum_{\alpha} p_{\alpha}=1, p_{\alpha} \geq 0$ | | :--- | :--- | :--- | | Density matrix | $\left\{\rho \in \mathbf{C}^{n \times n}\right\}$ | $\operatorname{Tr} \rho=1, \rho \geq 0$ | | Positive operator valued measure (POVM) | $\left\{O_{\alpha} \in \mathbf{C}^{n \times n}\right\}$ | $\sum_{\alpha} O_{\alpha}=I_{n}, O_{\alpha} \geq 0$ | | OSR in a fixed basis set | $\left\{X \in \mathbf{C}^{n^{2} \times n^{2}}\right\}$ | $\sum_{i j} X_{i j} B_{i}^{\dagger} B_{j}=I_{n}, X \geq 0$ |


31.2.5 谐振子


量子谐振子是最重要的例子之一,因为它的可处理性和在建模中的应用[46, Box 7.2],[44, Sec. 10.6],[47, Sec. 4.1]。光学腔和玻色子场的模型基于量子谐振子。


量子谐振子的希尔伯特空间是 H = L 2 ( R , C ) H = L 2 ( R , C ) H=L^(2)(R,C)\mathcal{H}=L^{2}(\mathbf{R}, \mathbf{C}) ,即定义在实线上的平方可积函数的向量空间。该系统的算符可以用湮灭算符 a a aa 表示,其中 a a a^(†)a^{\dagger} a a aa 的伴随算符,规范对易关系为 [ a , a ] = 1 a , a = 1 [a,a^(†)]=1\left[a, a^{\dagger}\right]=1 。湮灭算符的作用可以表示为
( a ψ ) ( x ) = x ψ ( x ) i d ψ d x ( x ) ( a ψ ) ( x ) = x ψ ( x ) i d ψ d x ( x ) (a psi)(x)=x psi(x)-i(d psi)/(dx)(x)(a \psi)(x)=x \psi(x)-i \frac{d \psi}{d x}(x)

H H H\mathcal{H} 的函数(向量) ψ ψ psi\psi 的领域上。 a a a a a^(†)aa^{\dagger} a 的特征值是数字 0 , 1 , 2 , 0 , 1 , 2 , 0,1,2,dots0,1,2, \ldots (量子数),对应的特征向量表示为 ψ n ( n = 0 , 1 , 2 , ) ψ n ( n = 0 , 1 , 2 , ) psi_(n)(n=0,1,2,dots)\psi_{n}(n=0,1,2, \ldots) ,称为数态。我们有 a ψ n = n ψ n 1 a ψ n = n ψ n 1 apsi_(n)=sqrtnpsi_(n-1)a \psi_{n}=\sqrt{n} \psi_{n-1} a ψ n = n + 1 ψ n + 1 a ψ n = n + 1 ψ n + 1 a^(†)psi_(n)=sqrt(n+1)psi_(n+1)a^{\dagger} \psi_{n}=\sqrt{n+1} \psi_{n+1}

如果谐振子具有哈密顿量 H = ω a a H = ω a a H=omegaa^(†)aH=\omega a^{\dagger} a ,则湮灭算子的演化由 a ( t ) = U ( t ) a U ( t ) a ( t ) = U ( t ) a U ( t ) a(t)=U^(†)(t)aU(t)a(t)=U^{\dagger}(t) a U(t) 定义,其中 U ( t ) U ( t ) U(t)U(t) 是单位算子(或矩阵,具体取决于上下文),用于求解薛定谔方程 31.1,即 a ˙ ( t ) = i [ a ( t ) , H ] = i ω a ( t ) a ˙ ( t ) = i [ a ( t ) , H ] = i ω a ( t ) a^(˙)(t)=-i[a(t),H]=-i omega a(t)\dot{a}(t)=-i[a(t), H]=-i \omega a(t) ,初始条件为 a ( 0 ) = a a ( 0 ) = a a(0)=aa(0)=a 。因此, a ( t ) = e i ω t a a ( t ) = e i ω t a a(t)=e^(-i omega t)aa(t)=e^{-i \omega t} a ,从中我们可以明确看到对易关系得以保持: [ a ( t ) , a ( t ) ] = [ a , a ] = 1 a ( t ) , a ( t ) = a , a = 1 [a(t),a^(†)(t)]=[a,a^(†)]=1\left[a(t), a^{\dagger}(t)\right]=\left[a, a^{\dagger}\right]=1 对所有 t t tt

实部和虚部的正交是自伴算子 q = 1 2 ( a + a ) q = 1 2 a + a q=(1)/(sqrt2)(a+a^(†))q=\frac{1}{\sqrt{2}}\left(a+a^{\dagger}\right) p = i 2 p = i 2 p=-(i)/(sqrt2)p=-\frac{i}{\sqrt{2}} ( a a ) a a (a-a^(†))\left(a-a^{\dagger}\right) ,分别。我们可以形成向量 x = ( q , p ) T x = ( q , p ) T x=(q,p)^(T)x=(q, p)^{T} ,这样在正交形式下,振荡器的动态由 x ˙ ( t ) = A x ( t ) x ˙ ( t ) = A x ( t ) x^(˙)(t)=Ax(t)\dot{x}(t)=A x(t) 给出,明确地。
[ q ˙ ( t ) p ˙ ( t ) ] = [ 0 ω ω 0 ] [ q ( t ) p ( t ) ] q ˙ ( t ) p ˙ ( t ) = 0 ω ω 0 q ( t ) p ( t ) [[q^(˙)(t)],[p^(˙)(t)]]=[[0,omega],[-omega,0]][[q(t)],[p(t)]]\left[\begin{array}{l} \dot{q}(t) \\ \dot{p}(t) \end{array}\right]=\left[\begin{array}{cc} 0 & \omega \\ -\omega & 0 \end{array}\right]\left[\begin{array}{l} q(t) \\ p(t) \end{array}\right]

注意到在方程 31.7 中出现的矩阵 A A AA 具有特殊形式。对易关系为 [ q , p ] = i [ q , p ] = i [q,p]=i[q, p]=i ,可以用向量 x x xx 表示如下: [ x j , x k ] = i J j k x j , x k = i J j k [x_(j),x_(k)]=iJ_(jk)\left[x_{j}, x_{k}\right]=i J_{j k} ,其中
J = [ 0 1 1 0 ] J = 0 1 1 0 J=[[0,1],[-1,0]]J=\left[\begin{array}{cc} 0 & 1 \\ -1 & 0 \end{array}\right]

矩阵 A A AA 满足 A J + J A T = 0 A J + J A T = 0 AJ+JA^(T)=0A J+J A^{T}=0 ,这个关系足以确定哈密顿量 H H HH :我们有 H = 1 2 x T R x H = 1 2 x T R x H=(1)/(2)x^(T)RxH=\frac{1}{2} x^{T} R x ,其中 R = 1 2 ( J A + A T J ) R = 1 2 J A + A T J R=(1)/(2)(-JA+A^(T)J)R=\frac{1}{2}\left(-J A+A^{T} J\right) 。正如我们下面将看到的,代数关系在表征量子系统中起着基础性作用,并可以用于物理实现 [25,31]。

谐振子构成了本章讨论的量子线性系统的基础(第 31.5.1 节)。我们将始终考虑高斯态,这意味着所有象限的概率分布都是经典高斯测度。

 31.2.6 玻色场


在量子力学中,电磁场,例如光束,被描述为玻色子场。在第 31.2.7 节和第 31.5 节中讨论的系统中,我们使用量子随机模型,这些模型源于更基本模型的旋转波和马尔可夫近似。


这种理想化提供了相当的透明度和可处理性,并准确描述了量子光学中广泛的情况。

一个玻色场通道由具有奇异对易关系的无限个振荡器表示。在时间域中,我们有湮灭算符 b ( t ) b ( t ) b(t)b(t) ,它们满足 [ b ( t ) , b ( s ) ] = δ ( t s ) b ( t ) , b ( s ) = δ ( t s ) [b(t),b^(†)(s)]=delta(t-s)\left[b(t), b^{\dagger}(s)\right]=\delta(t-s) 。当场处于真空态时,协方差为 b ( t ) b ( t ) = δ ( t t ) b ( t ) b t = δ t t (:b(t)b^(†)(t^(')):)=delta(t-t^('))\left\langle b(t) b^{\dagger}\left(t^{\prime}\right)\right\rangle=\delta\left(t-t^{\prime}\right) 。实部和虚部场的正交量分别由 b r ( t ) = b ( t ) + b ( t ) b r ( t ) = b ( t ) + b ( t ) b_(r)(t)=b(t)+b^(†)(t)b_{r}(t)=b(t)+b^{\dagger}(t) b i ( t ) = i ( b ( t ) b ( t ) ) b i ( t ) = i b ( t ) b ( t ) b_(i)(t)=-i(b(t)-b^(†)(t))b_{i}(t)=-i\left(b(t)-b^{\dagger}(t)\right) 定义(类似于交流电路分析中的相量表示)。当场处于真空态时,这两个正交量各自等价于经典维纳过程,但它们不对易。


在四分量形式中,协方差被捕捉在由非负厄米矩阵 F F FF 定义的矩阵中
F = [ b r ( t ) b i ( t ) ] [ b r ( s ) b i ( s ) ] = ( I + i J ) δ ( t s ) F = b r ( t ) b i ( t ) b r ( s ) b i ( s ) = ( I + i J ) δ ( t s ) F=(:[[b_(r)(t)],[b_(i)(t)]][[b_(r)(s),b_(i)(s)]]:)=(I+iJ)delta(t-s)F=\left\langle\left[\begin{array}{l} b_{r}(t) \\ b_{i}(t) \end{array}\right]\left[\begin{array}{ll} b_{r}(s) & b_{i}(s) \end{array}\right]\right\rangle=(I+i J) \delta(t-s)

 31.2.7 光学腔


腔体是量子光学系统中的基本元素(图 31.8a)。在图 31.8b 中,展示了一个腔体的示意图,腔体由一对镜子组成,镜子之间建立了一个被捕获的电磁(光学)模式,其频率取决于镜子之间的距离。


该模式由一个具有湮灭算符 a a aa 的谐振子描述(如第 31.2.5 节所述)。部分透射镜为该模式与外部自由场 B B BB 的相互作用提供了机会。当外部场处于真空态时,最初在腔模内的能量可能会泄漏出去,在这种情况下,腔系统是一个阻尼谐振子[47]。

腔体是开放量子系统的一个例子,见第 31.2.3 节,其中 S S SS -系统是内部腔模,而 E E EE -系统是外部自由传播的场。薛定谔方程为

(a)

图 31.8 (a) 在量子光学系统中由一对镜子构成的腔体(由 E. Huntington 提供)。


(b) 一个简化的腔体表示,由两个镜子组成,其中一个是完全反射的,而另一个是部分透射的(未填充显示)。部分透射镜使得腔体内部的光模式 a a aa 能够与外部光场(例如激光束)相互作用。外部光场通过法拉第隔离器(未显示)分为输入 b in ( t ) b in  ( t ) b_("in ")(t)b_{\text {in }}(t) 和输出 b out ( t ) b out  ( t ) b_("out ")(t)b_{\text {out }}(t) 组件。


腔体在斯特拉托诺维奇形式中,
U ˙ ( t ) = { γ a b i n ( t ) γ a b i n ( t ) i ω a a } U ( t ) , U ( 0 ) = I U ˙ ( t ) = γ a b i n ( t ) γ a b i n ( t ) i ω a a U ( t ) , U ( 0 ) = I U^(˙)(t)={sqrtgammaab_(in)^(†)(t)-sqrtgammaa^(†)b_(in)(t)-i omegaa^(†)a}U(t),quad U(0)=I\dot{U}(t)=\left\{\sqrt{\gamma} a b_{i n}^{\dagger}(t)-\sqrt{\gamma} a^{\dagger} b_{i n}(t)-i \omega a^{\dagger} a\right\} U(t), \quad U(0)=I

在这里, γ γ gamma\gamma 是腔模与外部场耦合强度的度量, ω ω omega\omega 是对应于腔与外部场之间失谐程度的频率参数。算符 L = γ a L = γ a L=sqrtgammaaL=\sqrt{\gamma} a 被称为耦合算符。腔模根据 a ( t ) = U ( t ) a U ( t ) a ( t ) = U ( t ) a U ( t ) a(t)=U^(†)(t)aU(t)a(t)=U^{\dagger}(t) a U(t) 发展,因此
a ˙ ( t ) = ( γ 2 + i ω ) a ( t ) γ b i n ( t ) , a ( 0 ) = a a ˙ ( t ) = γ 2 + i ω a ( t ) γ b i n ( t ) , a ( 0 ) = a a^(˙)(t)=-((gamma)/(2)+i omega)a(t)-sqrtgammab_(in)(t),quad a(0)=a\dot{a}(t)=-\left(\frac{\gamma}{2}+i \omega\right) a(t)-\sqrt{\gamma} b_{i n}(t), \quad a(0)=a
 以四分之一形式,
[ q ˙ ( t ) p ˙ ( t ) ] = [ γ 2 ω ω γ 2 ] [ q ( t ) p ( t ) ] + [ γ 0 0 γ ] [ b i n , r ( t ) b i n , i ( t ) ] q ˙ ( t ) p ˙ ( t ) = γ 2 ω ω γ 2 q ( t ) p ( t ) + γ 0 0 γ b i n , r ( t ) b i n , i ( t ) [[q^(˙)(t)],[p^(˙)(t)]]=[[-(gamma)/(2),omega],[-omega,-(gamma)/(2)]][[q(t)],[p(t)]]+[[-sqrtgamma,0],[0,-sqrtgamma]][[b_(in,r)(t)],[b_(in,i)(t)]]\left[\begin{array}{l} \dot{q}(t) \\ \dot{p}(t) \end{array}\right]=\left[\begin{array}{cc} -\frac{\gamma}{2} & \omega \\ -\omega & -\frac{\gamma}{2} \end{array}\right]\left[\begin{array}{l} q(t) \\ p(t) \end{array}\right]+\left[\begin{array}{cc} -\sqrt{\gamma} & 0 \\ 0 & -\sqrt{\gamma} \end{array}\right]\left[\begin{array}{l} b_{i n, r}(t) \\ b_{i n, i}(t) \end{array}\right]

换算关系被保留。方程 31.11 是形式为 x ˙ ( t ) = A x ( t ) + x ˙ ( t ) = A x ( t ) + x^(˙)(t)=Ax(t)+\dot{x}(t)=A x(t)+ B w ( t ) B w ( t ) Bw(t)B w(t) 的线性系统,其中 A A AA B B BB 是方程 31.11 和 w ( t ) = ( b i n , r ( t ) , b i n , i ( t ) ) T w ( t ) = b i n , r ( t ) , b i n , i ( t ) T w(t)=(b_(in,r)(t),b_(in,i)(t))^(T)w(t)=\left(b_{i n, r}(t), b_{i n, i}(t)\right)^{T} 中的实矩阵。矩阵 A A AA B B BB 满足 i A J + i J A T + B T B T = 0 i A J + i J A T + B T B T = 0 iAJ+iJA^(T)+BTB^(T)=0i A J+i J A^{T}+B T B^{T}=0 ,其中 T = 1 2 ( F F T ) T = 1 2 F F T T=(1)/(2)(F-F^(T))T=\frac{1}{2}\left(F-F^{T}\right) 。如果满足此关系,哈密顿量 H = 1 2 x T R x H = 1 2 x T R x H=(1)/(2)x^(T)RxH=\frac{1}{2} x^{T} R x 和耦合算符 L = M x L = M x L=MxL=M x R = 1 4 ( J A + A T J ) R = 1 4 J A + A T J R=(1)/(4)(-JA+A^(T)J)R=\frac{1}{4}\left(-J A+A^{T} J\right) M = γ 2 ( 1 , i ) M = γ 2 ( 1 , i ) M=(sqrtgamma)/(2)(1,i)M=\frac{\sqrt{\gamma}}{2}(1, i) 确定。

输出字段 y ( t ) = ( b out , r ( t ) , y out , i ( t ) ) T y ( t ) = b out  , r ( t ) , y out  , i ( t ) T y(t)=(b_("out ",r)(t),y_("out ",i)(t))^(T)y(t)=\left(b_{\text {out }, r}(t), y_{\text {out }, i}(t)\right)^{T} 以正交形式给出,表示为
[ b out , r ( t ) b out , i ( t ) ] = [ γ 0 0 γ ] [ q ( t ) p ( t ) ] + [ b in , r ( t ) b in , i ( t ) ] b out  , r ( t ) b out  , i ( t ) = γ 0 0 γ q ( t ) p ( t ) + b in  , r ( t ) b in  , i ( t ) [[b_("out ",r)(t)],[b_("out ",i)(t)]]=[[sqrtgamma,0],[0,sqrtgamma]][[q(t)],[p(t)]]+[[b_("in ",r)(t)],[b_("in ",i)(t)]]\left[\begin{array}{l} b_{\text {out }, r}(t) \\ b_{\text {out }, i}(t) \end{array}\right]=\left[\begin{array}{cc} \sqrt{\gamma} & 0 \\ 0 & \sqrt{\gamma} \end{array}\right]\left[\begin{array}{l} q(t) \\ p(t) \end{array}\right]+\left[\begin{array}{l} b_{\text {in }, r}(t) \\ b_{\text {in }, i}(t) \end{array}\right]

该输出方程的形式为 y ( t ) = C x ( t ) + D w ( t ) y ( t ) = C x ( t ) + D w ( t ) y(t)=Cx(t)+Dw(t)y(t)=C x(t)+D w(t) 。请注意 B = J C T J B = J C T J B=JC^(T)JB=J C^{T} J D = I D = I D=ID=I


31.3 量子估计与控制的方法

 31.3.1 估算


量子估计可以分为几个大类:量子态层析(QST)、量子过程层析(QPT)和量子参数估计(QPE)。在 QST 中,估计密度矩阵 ρ ρ rho\rho 。在 QPT 中,估计一个称为过程矩阵的矩阵,从中可以恢复 OSR 元素。在 QPT 中,估计哈密顿模型中的不确定参数。

在量子状态 tomography (QST) 和量子过程 tomography (QPT) 中,测量与待估计的参数是线性的。此外,量子态(密度矩阵)和过程矩阵都受到物理学的约束,限制在凸集内。


两者的方法自然倾向于成熟的最小二乘法和最大似然法,例如,[45,48]。由此产生的估计问题是一个凸优化问题,因此原则上是可处理的[49]。


不幸的是,QST 的参数空间维度,尤其是 QPT,可能是不可承受的:对于希尔伯特空间维度 n n nn ,QST 的规模与 n 2 n 2 n^(2)n^{2} 成比例,而 QPT 与 n 4 n 4 n^(4)n^{4} 成比例。对于 q q qq 量子比特,* n = 2 2 n = 2 2 n=2^(2)n=2^{2} ,因此两者的规模在量子比特数量上是指数级的。


尽管这给计算带来了负担,但它也对资源施加了同样的负担,例如,所应用的输入和测量设备的数量,以及为了达到所需精度而进行的实验数量。


已经开发出多种方法来减轻这一规模负担。值得注意的是各种形式的辅助量子过程 tomography (QPT)(参见[50]的综述)、使用对称化来估计选定的过程属性[51],以及利用先前建模来简化过程矩阵参数的方法[52]。通过辅助,规模的增长率得以降低,但仍然是指数级的。


此外,辅助方法可能需要纠缠输入,而这些输入对噪声和退相干非常敏感。

最近,压缩感知(CS)估计方法[53-55]已被应用于量子过程 tomography(QPT)[56,57]。CS 预测测量资源的规模为 s log N s log N s log Ns \log N ,其中 s s ss 是待估计的 N N NN 维信号的稀疏性水平。此外,CS 过程需要解决一个凸优化问题。对于具有 q q qq 个量子比特的 QPT, N = ( 2 q ) 4 N = 2 q 4 N=(2^(q))^(4)N=\left(2^{q}\right)^{4} ,因此,CS 预示着规模的增长在 sq 的数量级上。


正如我们稍后将展示的,以及在[56]中所提出的,对于一个初始设计良好的系统,其动态接近于期望的单位(量子计算中的一个主要目标),在对应于理想单位的基下,过程矩阵几乎是稀疏的,也就是说,存在一个 s s ss -稀疏估计,它在测量噪声的情况下产生的估计误差低于任何期望水平。

QPE 指的是在量子系统模型中估计参数,通常是哈密顿模型。


量子参数估计(QPE)的一个重要子集是量子计量学,在这里,感兴趣的信息通常包含在一个无法直接测量的单一参数中,例如,光学干涉仪两个臂之间的相位差估计,或原子钟的跃迁频率。


例如,图 31.9 显示了经典马赫-曾德干涉仪用于相位估计的示意图。

对于单参数(相位)估计,在理想无噪声情况下理论精度的极限已被深入研究,例如,[58-63]。


这些研究表明,仪器的特殊准备——探头——可以实现小于克拉美尔-拉奥下界的渐近方差,即所谓的量子克拉美尔-拉奥界限或量子费舍尔信息(QFI)。


具体而言,纠缠的独特量子特性可以将参数估计的收敛性从经典极限 1 / N 1 / N 1//sqrtN1 / \sqrt{N} 提高到海森堡极限 1 / N 1 / N 1//N1 / N ,这源于不确定性原理[64]。在后者情况下, N N NN 指的是纠缠态的维度。纠缠态对噪声和去相干非常敏感,因此抑制了理论量子费舍信息(QFI)的实现。除此之外,

图 31.9 经典马赫-曾德干涉仪。一个相干光束被分成两部分。通过分析两个输出光束的光子统计,估计两个光学臂之间的相位差 ϕ ϕ phi\phi 。(BS:分束器,PD:光电探测器)


敏感性,QFI 可能也无法达到,仅仅因为仪器的限制,也就是说,并非所有状态都可以被准备,并且并非所有测量方案都是可能的。

一般来说,哈密顿量当然对理解大多数物理现象是有用的。


如果一个量子系统要用来模拟另一个量子系统的动态(费曼对量子计算机应用的最初想法),那么准确高效地表征量子过程的能力将是至关重要的。


有人说自适应控制实验表明我们已经制造了量子计算机:唯一的问题是我们不知道正在解决什么方程,因为我们不知道 H H HH ,哈密顿量[5,8,65]。此外, H H HH 实际上是由外部场操控的,也就是说,外部场在驱动场开启时创造了一个“静态”的新哈密顿量。虽然这里没有讨论,但最近 CS 已被应用于哈密顿量估计[66]。

 31.3.2 控制


我们如何控制量子系统?假设控制薛定谔方程 31.1 的系统哈密顿量 H H HH 依赖于一个外部控制变量 u u uu ,即 H = H 0 + H 1 u H = H 0 + H 1 u H=H_(0)+H_(1)uH=H_{0}+H_{1} u ,因此薛定谔方程的形式为
U ˙ = i ( H 0 + H 1 u ) U , 0 t t f , U ( 0 ) = I U ˙ = i H 0 + H 1 u U , 0 t t f , U ( 0 ) = I U^(˙)=-i(H_(0)+H_(1)u)U,quad0 <= t <= t_(f),quad U(0)=I\dot{U}=-i\left(H_{0}+H_{1} u\right) U, \quad 0 \leq t \leq t_{f}, \quad U(0)=I

显然,这个方程是双线性的,因为它涉及到控制变量 u u uu 和单位算子 U U UU 在每个时间点的乘积。系统方程 31.13 的最简单控制问题是选择一个开环控制信号 u ( t ) u ( t ) u(t)u(t) ,使得在最终时间 t f , U ( t f ) t f , U t f t_(f),U(t_(f))t_{f}, U\left(t_{f}\right) 的单位算子等于或接近期望的单位算子 U d e s U d e s U_(des)U_{d e s} 。这个问题是完全确定性的,从开创性论文[22]开始,已经积累了大量文献,研究使用非线性控制理论的方法来研究这种类型的系统,并将结果应用于一系列问题(例如, [ 16 , 67 ] [ 16 , 67 ] [16,67][16,67] ,特别是最近关于动态解耦的工作 [ 68 , 69 ] [ 68 , 69 ] [68,69][68,69] )。由于量子态的演化依赖于单位算子,因此可以控制基础物理系统的基本统计行为。

量子控制是否仅仅是经典非线性控制的一种形式?如果我们希望使用反馈来控制量子系统,答案是否定的。


自 1980 年代初以来,在量子系统反馈控制方面取得的进展依赖于更复杂的模型。这些更先进模型的发展受到关键领域快速而显著进展的刺激。


量子物理领域,即量子光学。随着时间的推移,从量子光学系统的反馈控制中获得的经验教训将影响其他物理背景下反馈控制的发展。


据我们所知,关于量子反馈控制的最早出版物是 Belavkin 的论文[10],该论文讨论了开放量子模型、滤波和最优测量反馈控制。


后来,贝拉夫金发展了量子滤波的一般理论[12],其中包括量子光学中的随机主方程[70]。量子控制理论发展的一个重要里程碑是威斯曼和米尔本在 1990 年代初的工作[38,71,72]。


最近出版了一本关于量子测量和控制的优秀著作[73]。

可以根据开放量子系统的量子噪声模型来制定广泛的控制问题,其中腔体模型方程 31.9 就是一个例子,[47,74]。


特别地,最优控制问题可以通过指定合适的成本函数来表述[17,23,75,76]。一般来说,这些问题在解析上很难解决,尽管原则上可以应用动态规划方法。


然而,对于经典随机系统,有一类测量反馈问题可以获得封闭形式的解,即线性高斯量子随机系统 [17,75,77]。


尽管基础的单一方程在控制变量上是双线性的,但这一类线性量子系统的特殊特性意味着某些可观测量的演化由线性方程给出,这些方程保持高斯态——这就是计算可行性的原因。


在第 31.5 节中,我们介绍这些模型,并制定和解决几个控制问题。

人们还可以制定一致反馈最优控制问题。事实证明,由于线性高斯模型, H H H^(oo)H^{\infty} 问题是可处理的,关键在于对于这个问题,一致控制器中的物理约束的解决可以与优化解耦。


这在第 31.5.5 节中进行了描述。然而,连贯反馈 LQG 问题似乎并不计算简单[32]。


31.3.3 自适应与学习控制


在量子化学中,自适应和学习控制已在实验室中成功应用于数百个实验(图 31.10)[65,78]。


这些是直接自适应控制系统,没有为系统建立模型;只有性能指标可用,控制参数被调整以改善性能。


调整的“方向”显然必须依赖于“控制参数景观”的形状,否则就无法知道如何进行调整。一般来说,预计控制景观会有许多局部最优值。


因此,如果没有对景观的某些了解或全面的搜索,找到全局最优解可能会很困难。然而,令人惊讶的是,对量子系统控制的景观进行深入分析表明情况并非如此 [ 78 , 79 ] [ 78 , 79 ] [78,79][78,79] 。分析表明,对于不受约束的时变控制,如果系统是可控的,则所有局部最大值都是全局最大值,也就是说,在每个局部最大值处的结果概率为 1,而所有其他极值的概率为 0。


然而,当存在控制约束时,景观可能会表现出在自由漂浮的原始集合中并不明显的结构。

实验能够成功本身就相当令人惊讶。一个猜测是,对这些景观的检查将显示出相当多的细节,其中许多可能是由于高度受限的控制而产生的虚假结构。


从积极的角度来看,随着带宽的增加,控制环境变得不那么复杂,更加规律,因为更多的局部最优值提供的性能接近全局最优。

 31.4 量子估计


在接下来的几个小节中,我们将简要回顾量子估计的算法。其中许多算法基于量子力学变量的内在凸性。

图 31.10 迭代学习控制。相同的方案用于从重复的相同实验中进行估计。在每次迭代中使用一个新的量子系统,QS1,QS2,QS3,…

应用包括:用于状态和过程层析以及哈密顿参数估计的机器学习估计和最优实验设计(OED),量子态检测和量子错误纠正。


凸优化的一个重大优势是可以高效且可靠地找到全局最优解。

最大似然估计问题包括状态(密度)估计、已知输入状态分布的最大似然估计、量子过程中的 OSR 元素的最大似然估计,以及哈密顿参数的最大似然估计。


与这些估计问题相关的是一个 OED,由 Cramer-Rao 不等式引入,可以确定系统配置以最大化估计精度。

设计一个对特定量子态最大敏感的探测器可以被表述为一个在 POVM 矩阵中的凸优化问题,这些矩阵表征了测量设备。


例如,最大化检测的后验概率是 POVM 元素中的一个准凸优化问题。

设计量子信息纠错程序可以被视为一个双凸优化问题,在编码和恢复之间迭代,每个都是半正定程序。对于给定的编码算子,该问题在恢复算子中是凸的。


对于给定的恢复方法,编码方案中的问题是凸的。这允许推导出比标准代码在误差系统的不确定性范围内更稳健的代码。


量子态层析成像

 31.4.1.1 收集数据


对于量子态估计,数据通常是从每个配置中相同的实验中收集的,重复 γ γ ℓ_(gamma)\ell_{\gamma} 次。图 31.11 中示出了配置 γ γ gamma\gamma 的量子态测量(QST)数据收集的设置示意图。

图 31.11 在配置 γ γ gamma\gamma 中进行数据收集用于 QST。

在这里, ρ true C n × n ρ true  C n × n rho^("true ")inC^(n xx n)\rho^{\text {true }} \in \mathbf{C}^{n \times n} 是要估计的真实未知状态, n α γ n α γ n_(alpha gamma)n_{\alpha \gamma} 是在 γ γ ℓ_(gamma)\ell_{\gamma} 次实验中获得结果 α α alpha\alpha 的次数, { M α γ } M α γ {M_(alpha gamma)}\left\{M_{\alpha \gamma}\right\} 是测量设备的 POVM 元素。因此,数据集由所有结果计数组成。
D = { n α γ α = 1 , , n out , γ = 1 , , n cfg } D = n α γ α = 1 , , n out  , γ = 1 , , n cfg D={n_(alpha gamma)∣alpha=1,dots,n_("out "),gamma=1,dots,n_(cfg)}D=\left\{n_{\alpha \gamma} \mid \alpha=1, \ldots, n_{\text {out }}, \gamma=1, \ldots, n_{\mathrm{cfg}}\right\}

如果 p α γ true p α γ true  p_(alpha gamma)^("true ")p_{\alpha \gamma}^{\text {true }} 是系统在配置 γ γ gamma\gamma 下,状态输入 ρ true ρ true  rho^("true ")\rho^{\text {true }} 时获得结果 α α alpha\alpha 的真实概率,那么,
P n α γ = γ p α γ true P n α γ = γ p α γ true  Pn_(alpha gamma)=ℓ_(gamma)p_(alpha gamma)^("true ")\mathbb{P} n_{\alpha \gamma}=\ell_{\gamma} p_{\alpha \gamma}^{\text {true }}

期望 P ( ) P ( ) P(*)\mathbb{P}(\cdot) 是相对于基础量子概率分布关于 ρ true ρ true  rho^("true ")\rho^{\text {true }} 的。我们提出以下系统模型。
p α γ ( ρ ) = Tr M α γ Q γ ( ρ ) p α γ ( ρ ) = Tr M α γ Q γ ( ρ ) p_(alpha gamma)(rho)=TrM_(alpha gamma)Q_(gamma)(rho)p_{\alpha \gamma}(\rho)=\operatorname{Tr} M_{\alpha \gamma} Q_{\gamma}(\rho)

其中 p α γ ( ρ ) p α γ ( ρ ) p_(alpha gamma)(rho)p_{\alpha \gamma}(\rho) 是在系统处于配置 γ γ gamma\gamma 且输入状态 ρ ρ rho\rho 属于密度矩阵集合时测量 α α alpha\alpha 的结果概率
{ ρ C n × n ρ 0 , Tr ρ = 1 } ρ C n × n ρ 0 , Tr ρ = 1 {rho inC^(n xx n)∣rho >= 0,Tr rho=1}\left\{\rho \in \mathbf{C}^{n \times n} \mid \rho \geq 0, \operatorname{Tr} \rho=1\right\}

如果 Q γ Q γ Q_(gamma)Q_{\gamma} 被建模为具有元素 { K γ k } K γ k {K_(gamma k)}\left\{K_{\gamma k}\right\} 的 OSR,则模型概率结果在输入状态中是线性的,即,
p α γ ( ρ ) = Tr O α γ ρ , O α γ = k = 1 κ γ K γ k M α γ K γ k p α γ ( ρ ) = Tr O α γ ρ , O α γ = k = 1 κ γ K γ k M α γ K γ k p_(alpha gamma)(rho)=TrO_(alpha gamma)rho,quadO_(alpha gamma)=sum_(k=1)^(kappa_(gamma))K_(gamma k)^(†)M_(alpha gamma)K_(gamma k)p_{\alpha \gamma}(\rho)=\operatorname{Tr} O_{\alpha \gamma} \rho, \quad O_{\alpha \gamma}=\sum_{k=1}^{\kappa_{\gamma}} K_{\gamma k}^{\dagger} M_{\alpha \gamma} K_{\gamma k}
Moreover, the set { O α γ } O α γ {O_(alpha gamma)}\left\{O_{\alpha \gamma}\right\} is a POVM. If Q γ Q γ Q_(gamma)Q_{\gamma} is modeled as a unitary system, then
此外,集合 { O α γ } O α γ {O_(alpha gamma)}\left\{O_{\alpha \gamma}\right\} 是一个 POVM。如果 Q γ Q γ Q_(gamma)Q_{\gamma} 被建模为一个单位系统,则
Q γ ( ρ ) = U γ ρ U γ , U γ U γ = I n O α γ = U γ M α γ U γ Q γ ( ρ ) = U γ ρ U γ , U γ U γ = I n O α γ = U γ M α γ U γ Q_(gamma)(rho)=U_(gamma)rhoU_(gamma)^(†),quadU_(gamma)^(†)U_(gamma)=I_(n)LongrightarrowO_(alpha gamma)=U_(gamma)^(†)M_(alpha gamma)U_(gamma)Q_{\gamma}(\rho)=U_{\gamma} \rho U_{\gamma}^{\dagger}, \quad U_{\gamma}^{\dagger} U_{\gamma}=I_{n} \Longrightarrow O_{\alpha \gamma}=U_{\gamma}^{\dagger} M_{\alpha \gamma} U_{\gamma}
The set O γ O γ O_(gamma)O_{\gamma} is still a POVM with a single element, K γ = U γ K γ = U γ K_(gamma)=U_(gamma)K_{\gamma}=U_{\gamma}.
集合 O γ O γ O_(gamma)O_{\gamma} 仍然是一个具有单个元素 K γ = U γ K γ = U γ K_(gamma)=U_(gamma)K_{\gamma}=U_{\gamma} 的 POVM。

Figure 31.12 shows a schematic representation of an experimental setup for QST performed in the Clarendon Lab at Oxford. In this case, for the probability outcomes p α γ p α γ p_(alpha gamma)p_{\alpha \gamma}, the outcomes α { 0 , 1 } α { 0 , 1 } alpha in{0,1}\alpha \in\{0,1\} and the configurations γ { Ω , T } γ { Ω , T } gamma in{Omega,T}\gamma \in\{\Omega, T\} were selected from frequency and time of the fluoresence signal [80].
图 31.12 显示了在牛津的克拉伦登实验室进行 QST 的实验设置的示意图。在这种情况下,对于概率结果 p α γ p α γ p_(alpha gamma)p_{\alpha \gamma} ,结果 α { 0 , 1 } α { 0 , 1 } alpha in{0,1}\alpha \in\{0,1\} 和配置 γ { Ω , T } γ { Ω , T } gamma in{Omega,T}\gamma \in\{\Omega, T\} 是从荧光信号的频率和时间中选择的[80]。

31.4.1.2 Maximum Likelihood
31.4.1.2 最大似然估计

The ML approach to quantum state estimation presented in this section, as well as observing that the estimation is convex, can be found in [ 81 , 82 ] [ 81 , 82 ] [81,82][81,82] and the references therein. Using convex programming methods, such as an interior-point algorithm for computation, was not exploited in these references.
本节中提出的量子态估计的机器学习方法,以及观察到估计是凸的,可以在 [ 81 , 82 ] [ 81 , 82 ] [81,82][81,82] 及其中的参考文献中找到。这些参考文献中并未利用凸编程方法,例如用于计算的内点算法。
If the experiments are independent, then the probability of obtaining the data (Equation 3.14) is a product of the individual model probabilities (Equation 3.16). Consequently, for an assumed initial state ρ ρ rho\rho, the model predicts that the probability of obtaining the data set (Equation 3.14) is given by, P { D , ρ } = P { D , ρ } = P{D,rho}=\mathbf{P}\{D, \rho\}= α , γ p α γ ( ρ ) n α γ α , γ p α γ ( ρ ) n α γ prod_(alpha,gamma)p_(alpha gamma)(rho)^(n_(alpha)gamma)\prod_{\alpha, \gamma} p_{\alpha \gamma}(\rho)^{n_{\alpha} \gamma}. The data are thus captured in the outcome counts { n α γ } n α γ {n_(alpha gamma)}\left\{n_{\alpha \gamma}\right\}, whereas the model terms have a ρ ρ rho\rho-dependence. The ML estimate of ρ ρ rho\rho is obtained by finding a ρ ρ rho\rho in the set (Equation 3.17) which maximizes
如果实验是独立的,那么获得数据的概率(方程 3.14)是各个模型概率(方程 3.16)的乘积。因此,对于假设的初始状态 ρ ρ rho\rho ,模型预测获得数据集的概率(方程 3.14)由 P { D , ρ } = P { D , ρ } = P{D,rho}=\mathbf{P}\{D, \rho\}= α , γ p α γ ( ρ ) n α γ α , γ p α γ ( ρ ) n α γ prod_(alpha,gamma)p_(alpha gamma)(rho)^(n_(alpha)gamma)\prod_{\alpha, \gamma} p_{\alpha \gamma}(\rho)^{n_{\alpha} \gamma} 给出。因此,数据被捕获在结果计数 { n α γ } n α γ {n_(alpha gamma)}\left\{n_{\alpha \gamma}\right\} 中,而模型项具有 ρ ρ rho\rho -依赖性。 ρ ρ rho\rho 的最大似然估计通过在集合中找到一个 ρ ρ rho\rho (方程 3.17)来获得,该 ρ ρ rho\rho 最大化。
Diatomic molecular system
双原子分子系统
Electronic transition 电子跃迁
Signal from fluorescence measurements of vibrations
来自荧光测量振动的信号
FIGURE 31.12 QST in the lab. State tomography of vibrational wavepackets in diatomic molecules.
图 31.12 实验室中的 QST。二原子分子中振动波包的状态层析。

the P { D , ρ } P { D , ρ } P{D,rho}\mathbf{P}\{D, \rho\}, or equivalently, minimizes the negative log log log\log-likelihood function, L ( D , ρ ) = log P { D , ρ } L ( D , ρ ) = log P { D , ρ } L(D,rho)=-log P{D,rho}L(D, \rho)=-\log \mathbf{P}\{D, \rho\}. The ML state estimate, ρ ML ρ ML rho^(ML)\rho^{\mathrm{ML}}, is obtained as the solution to the optimization problem
P { D , ρ } P { D , ρ } P{D,rho}\mathbf{P}\{D, \rho\} ,或等价地,最小化负 log log log\log -似然函数 L ( D , ρ ) = log P { D , ρ } L ( D , ρ ) = log P { D , ρ } L(D,rho)=-log P{D,rho}L(D, \rho)=-\log \mathbf{P}\{D, \rho\} 。最大似然状态估计 ρ ML ρ ML rho^(ML)\rho^{\mathrm{ML}} 作为优化问题的解得出。
minimize L ( D , ρ ) = α , γ n α γ log Tr O α γ ρ subject to ρ 0 , Tr ρ = 1 minimize L ( D , ρ ) = α , γ n α γ log Tr O α γ ρ  subject to  ρ 0 , Tr ρ = 1 {:[minimize,L(D","rho)=-sum_(alpha,gamma)n_(alpha gamma)log TrO_(alpha gamma)rho],[" subject to ",rho >= 0","quad Tr rho=1]:}\begin{array}{ll} \operatorname{minimize} & L(D, \rho)=-\sum_{\alpha, \gamma} n_{\alpha \gamma} \log \operatorname{Tr} O_{\alpha \gamma} \rho \\ \text { subject to } & \rho \geq 0, \quad \operatorname{Tr} \rho=1 \end{array}
L ( D , ρ ) L ( D , ρ ) L(D,rho)L(D, \rho) is a positively weighted sum of log-convex functions of ρ ρ rho\rho, and hence, is a log-convex function of ρ ρ rho\rho. The constraint that ρ ρ rho\rho is a density matrix forms a convex set in ρ ρ rho\rho. Hence, Equation 31.20 is in a category of a class of well-studied log-convex optimization problems, for example, [49].
L ( D , ρ ) L ( D , ρ ) L(D,rho)L(D, \rho) ρ ρ rho\rho 的对数凸函数的正权重和,因此是 ρ ρ rho\rho 的对数凸函数。约束条件 ρ ρ rho\rho 是一个密度矩阵,形成了 ρ ρ rho\rho 中的一个凸集。因此,方程 31.20 属于一类研究较多的对数凸优化问题,例如 [49]。

31.4.1.3 Least Squares 31.4.1.3 最小二乘法

In a typical application, the number of trials per configuration, γ γ ℓ_(gamma)\ell_{\gamma}, is sufficiently large so that the empirical estimate of the outcome probability, is a good estimate of the true outcome probability p α γ true p α γ true  p_(alpha gamma)^("true ")p_{\alpha \gamma}^{\text {true }}
在典型应用中,每个配置的试验次数 γ γ ℓ_(gamma)\ell_{\gamma} 足够大,以至于结果概率的经验估计是对真实结果概率 p α γ true p α γ true  p_(alpha gamma)^("true ")p_{\alpha \gamma}^{\text {true }} 的良好估计
p α γ emp = n α γ γ p α γ true p α γ emp = n α γ γ p α γ true  p_(alpha gamma)^(emp)=(n_(alpha gamma))/(ℓ_(gamma))~~p_(alpha gamma)^("true ")p_{\alpha \gamma}^{\mathrm{emp}}=\frac{n_{\alpha \gamma}}{\ell_{\gamma}} \approx p_{\alpha \gamma}^{\text {true }}
This leads to the least squares (LS) state estimate ρ LS ρ LS rho^(LS)\rho^{\mathrm{LS}} as the solution to the constrained weighted LS problem
这导致最小二乘(LS)状态估计 ρ LS ρ LS rho^(LS)\rho^{\mathrm{LS}} 作为约束加权最小二乘问题的解
minimize α , γ [ p α γ emp Tr O α γ ρ ] 2 subject to ρ 0 , Tr ρ = 1 minimize α , γ p α γ emp Tr O α γ ρ 2  subject to  ρ 0 , Tr ρ = 1 {:[minimize,sum_(alpha,gamma)[p_(alpha gamma)^(emp)-TrO_(alpha gamma)rho]^(2)],[" subject to ",rho >= 0","quad Tr rho=1]:}\begin{array}{ll} \operatorname{minimize} & \sum_{\alpha, \gamma}\left[p_{\alpha \gamma}^{\mathrm{emp}}-\operatorname{Tr} O_{\alpha \gamma} \rho\right]^{2} \\ \text { subject to } & \rho \geq 0, \quad \operatorname{Tr} \rho=1 \end{array}

这显然是一个凸优化问题。对于较大的 γ γ ℓ_(gamma)\ell_{\gamma} ,最小二乘解和最大似然解(方程 31.20)几乎是相同的。


31.4.1.4 最优实验设计


在本节中,我们描述量子态估计的实验设计问题。目标是选择每个配置的实验数量,即向量 = [ 1 n cfg ] T R n cfg = 1 n cfg T R n cfg ℓ=[ℓ_(1)cdotsℓ_(n_(cfg))]^(T)inR^(n_(cfg))\ell=\left[\ell_{1} \cdots \ell_{n_{\mathrm{cfg}}}\right]^{T} \in \mathbf{R}^{n_{\mathrm{cfg}}} 的元素,以最小化状态估计 ρ ^ ( ) ρ ^ ( ) widehat(rho)(ℓ)\widehat{\rho}(\ell) 与真实状态 ρ true ρ true  rho^("true ")\rho^{\text {true }} 之间的误差。具体来说,我们希望从中求解 \ell
minimize P ρ ^ ( ) ρ true frob 2 subject to γ γ = expt integer γ 0 , γ = 1 , , n cfg minimize P ρ ^ ( ) ρ true  frob  2  subject to  γ γ = expt   integer  γ 0 , γ = 1 , , n cfg {:[minimize,P||( widehat(rho))(ℓ)-rho^("true ")||_("frob ")^(2)],[" subject to ",sum_(gamma)ℓ_(gamma)=ℓ_("expt ")quad" integer "ℓ_(gamma) >= 0","gamma=1","dots","n_(cfg)]:}\begin{array}{ll} \operatorname{minimize} & \mathbb{P}\left\|\widehat{\rho}(\ell)-\rho^{\text {true }}\right\|_{\text {frob }}^{2} \\ \text { subject to } & \sum_{\gamma} \ell_{\gamma}=\ell_{\text {expt }} \quad \text { integer } \ell_{\gamma} \geq 0, \gamma=1, \ldots, n_{\mathrm{cfg}} \end{array}

其中 expt expt  ℓ_("expt ")\ell_{\text {expt }} 是所需的总实验次数。这是一个困难的问题,甚至可以说是无解的,原因有几个。首先,解决方案依赖于产生 ρ ^ ( ) ρ ^ ( ) widehat(rho)(ℓ)\widehat{\rho}(\ell) 的估计方法。其次,这个问题是整数组合问题,因为 \ell 是一个整数向量。最后,解决方案依赖于 ρ true ρ true  rho^("true ")\rho^{\text {true }}


被估计的状态。幸运的是,所有这些问题都可以规避。我们首先消除对估计方法的依赖。以下结果在[83]中使用 Cramér-Rao 不等式[84]建立。


31.4.1.4.1 状态估计方差下限


对于每个配置的 = [ 1 cfg ] = 1 cfg  ℓ=[ℓ_(1)cdotsℓ_("cfg ")]\ell=\left[\ell_{1} \cdots \ell_{\text {cfg }}\right] 次实验,假设 ρ ^ ( ) ρ ^ ( ) widehat(rho)(ℓ)\widehat{\rho}(\ell) ρ true ρ true  rho^("true ")\rho{ }^{\text {true }} 的无偏估计,即 P ρ ^ ( ) = ρ true P ρ ^ ( ) = ρ true  P widehat(rho)(ℓ)=rho^("true ")\mathbb{P} \widehat{\rho}(\ell)=\rho^{\text {true }} 。那么估计误差方差满足,
P ρ ^ ( ) ρ true frob 2 V ( , ρ true ) = Tr [ γ = 1 n cfg γ G γ ( ρ true ) ] 1 G γ ( ρ true ) = C eq T [ α ( vec O α γ ) ( vec O α γ ) / p α γ ( ρ true ) ] C eq R n 2 1 × n 1 2 P ρ ^ ( ) ρ true  frob  2 V , ρ true  = Tr γ = 1 n cfg  γ G γ ρ true  1 G γ ρ true  = C eq  T α vec O α γ vec O α γ / p α γ ρ true  C eq  R n 2 1 × n 1 2 {:[P||( widehat(rho))(ℓ)-rho^("true ")||_("frob ")^(2) >= V(ℓ,rho^("true "))=Tr[sum_(gamma=1)^(n_("cfg "))ℓ_(gamma)G_(gamma)(rho^("true "))]^(-1)],[G_(gamma)(rho^("true "))=C_("eq ")^(T)[sum_(alpha)(vecO_(alpha gamma))(vecO_(alpha gamma))^(†)//p_(alpha gamma)(rho^("true "))]C_("eq ")inR^(n^(2)-1xx n-1^(2))]:}\begin{aligned} & \mathbb{P}\left\|\widehat{\rho}(\ell)-\rho^{\text {true }}\right\|_{\text {frob }}^{2} \geq V\left(\ell, \rho^{\text {true }}\right)=\operatorname{Tr}\left[\sum_{\gamma=1}^{n_{\text {cfg }}} \ell_{\gamma} G_{\gamma}\left(\rho^{\text {true }}\right)\right]^{-1} \\ & G_{\gamma}\left(\rho^{\text {true }}\right)=C_{\text {eq }}^{T}\left[\sum_{\alpha}\left(\operatorname{vec} O_{\alpha \gamma}\right)\left(\operatorname{vec} O_{\alpha \gamma}\right)^{\dagger} / p_{\alpha \gamma}\left(\rho^{\text {true }}\right)\right] C_{\text {eq }} \in \mathbf{R}^{n^{2}-1 \times n-1^{2}} \end{aligned}

其中 C eq R n 2 × n 2 1 C eq R n 2 × n 2 1 C_(eq)inR^(n^(2)xxn^(2)-1)C_{\mathrm{eq}} \in \mathbf{R}^{n^{2} \times n^{2}-1} 来源于等式约束 Tr ρ = 1 Tr ρ = 1 Tr rho=1\operatorname{Tr} \rho=1


实验设计问题可以通过以下整数向量 \ell 的优化问题来表示:
minimize V ( , ρ true ) subject to γ γ = expt , integer γ 0 , γ = 1 , , n cfg minimize V , ρ true   subject to  γ γ = expt  ,  integer  γ 0 , γ = 1 , , n cfg {:[minimize,V(ℓ,rho^("true "))],[" subject to ",sum_(gamma)ℓ_(gamma)=ℓ_("expt ")","" integer "ℓ_(gamma) >= 0","gamma=1","dots","n_(cfg)]:}\begin{array}{ll} \operatorname{minimize} & V\left(\ell, \rho^{\text {true }}\right) \\ \text { subject to } & \sum_{\gamma} \ell_{\gamma}=\ell_{\text {expt }}, \text { integer } \ell_{\gamma} \geq 0, \gamma=1, \ldots, n_{\mathrm{cfg}} \end{array}

其中 expt expt  ℓ_("expt ")\ell_{\text {expt }} 是所需的总实验数量。好消息是目标 V ( , ρ true ) V , ρ true  V(ℓ,rho^("true "))V\left(\ell, \rho^{\text {true }}\right) [ 49 , $ 7.5 ] [ 49 , $ 7.5 ] ℓ[49,$7.5]\ell[49, \$ 7.5] 中是凸的。不幸的是,仍然存在两个障碍:(1) 将 \ell 限制为整数向量使问题变得组合;(2) 下界函数 V ( , ρ true ) V , ρ true  V(ℓ,rho^("true "))V\left(\ell, \rho^{\text {true }}\right) 依赖于真实值 ρ true ρ true  rho^("true ")\rho^{\text {true }} 。这些困难在一定程度上可以缓解。对于 (1),我们可以使用 [ 49 , $ 7 , 5 ] [ 49 , $ 7 , 5 ] [49,$7,5][49, \$ 7,5] 中描述的凸松弛。对于 (2),我们可以使用一组“假设”替代品 ρ surr ρ surr  rho^("surr ")\rho^{\text {surr }} 来解决放松的实验设计问题。这些可以用于启动,然后通过在状态估计和实验设计之间迭代来“引导”到更精确的值。

根据[49, §7.5]中的程序,引入变量 λ γ = γ / expt λ γ = γ / expt  lambda_(gamma)=ℓ_(gamma)//ℓ_("expt ")\lambda_{\gamma}=\ell_{\gamma} / \ell_{\text {expt }} ,每个变量是配置 γ γ gamma\gamma 中进行的实验总数的比例。由于所有 γ γ ℓ_(gamma)\ell_{\gamma} expt expt  ℓ_("expt ")\ell_{\text {expt }} 都是非负整数,因此每个 λ γ λ γ lambda_(gamma)\lambda_{\gamma} 都是非负且有理的,具体来说是 1 / expt 1 / expt  1//ℓ_("expt ")1 / \ell_{\text {expt }} 的整数倍,并且 γ λ γ = 1 γ λ γ = 1 sum_(gamma)lambda_(gamma)=1\sum_{\gamma} \lambda_{\gamma}=1 。如果 λ γ λ γ lambda_(gamma)\lambda_{\gamma} 仅被限制为非负实数,那么这将放宽 γ γ ℓ_(gamma)\ell_{\gamma} 为整数的约束。放宽的实验设计问题是
minimize V ( λ , ρ surr ) = Tr [ γ λ γ G γ ( ρ surr ) / expt ] 1 subject to γ λ γ = 1 , λ γ 0 , γ = 1 , , n cfg.  minimize  V λ , ρ surr  = Tr γ λ γ G γ ρ surr  / expt  1  subject to  γ λ γ = 1 , λ γ 0 , γ = 1 , , n cfg.  {:[" minimize ",V(lambda,rho^("surr "))=Tr[sum_(gamma)lambda_(gamma)G_(gamma)(rho^("surr "))//ℓ_("expt ")]^(-1)],[" subject to ",sum_(gamma)lambda_(gamma)=1","quadlambda_(gamma) >= 0","gamma=1","dots","n_("cfg. ")]:}\begin{array}{ll} \text { minimize } & V\left(\lambda, \rho^{\text {surr }}\right)=\operatorname{Tr}\left[\sum_{\gamma} \lambda_{\gamma} G_{\gamma}\left(\rho^{\text {surr }}\right) / \ell_{\text {expt }}\right]^{-1} \\ \text { subject to } & \sum_{\gamma} \lambda_{\gamma}=1, \quad \lambda_{\gamma} \geq 0, \gamma=1, \ldots, n_{\text {cfg. }} \end{array}

这是一个凸优化问题在 λ R n cfg λ R n cfg lambda inR^(n_(cfg))\lambda \in \mathbf{R}^{n_{\mathrm{cfg}}} 。让 λ opt λ opt  lambda^("opt ")\lambda^{\text {opt }} 表示方程 31.26 的最优解。由于该问题不再依赖于 expt , λ opt expt  , λ opt  ℓ_("expt "),lambda^("opt ")\ell_{\text {expt }}, \lambda^{\text {opt }} ,可以将其视为每个配置的实验分布。显然, expt λ opt expt  λ opt  ℓ_("expt ")lambda^("opt ")\ell_{\text {expt }} \lambda^{\text {opt }} 不一定是 1 / expt 1 / expt  1//ℓ_("expt ")1 / \ell_{\text {expt }} 的整数倍向量。获得 1 / expt 1 / expt  1//ℓ_("expt ")1 / \ell_{\text {expt }} 的整数倍向量的一个实用选择是 expt round = round { expt λ opt } expt  round  = round expt  λ opt  ℓ_("expt ")^("round ")=round{ℓ_("expt ")lambda^("opt ")}\ell_{\text {expt }}^{\text {round }}=\operatorname{round}\left\{\ell_{\text {expt }} \lambda^{\text {opt }}\right\} 。如果 opt opt  ℓ^("opt ")\ell^{\text {opt }} 是方程 31.25 的(未知)整数向量解,那么我们有以下关系:
V ( expt round , ρ surr ) V ( opt , ρ surr ) V ( expt λ opt , ρ surr ) V expt  round  , ρ surr  V opt  , ρ surr  V expt  λ opt  , ρ surr  V(ℓ_("expt ")^("round "),rho^("surr ")) >= V(ℓ^("opt "),rho^("surr ")) >= V(ℓ_("expt ")lambda^("opt "),rho^("surr "))V\left(\ell_{\text {expt }}^{\text {round }}, \rho^{\text {surr }}\right) \geq V\left(\ell^{\text {opt }}, \rho^{\text {surr }}\right) \geq V\left(\ell_{\text {expt }} \lambda^{\text {opt }}, \rho^{\text {surr }}\right)

最优目标因此被已知的放松优化值上下界定。最优解所处的区间不可能比 V ( expt round , ρ surr ) V expt  round  , ρ surr  V(ℓ_("expt ")^("round "),rho^("surr "))V\left(\ell_{\text {expt }}^{\text {round }}, \rho^{\text {surr }}\right) V ( expt λ opt , ρ surr ) V expt  λ opt  , ρ surr  V(ℓ_("expt ")lambda^("opt "),rho^("surr "))V\left(\ell_{\text {expt }} \lambda^{\text {opt }}, \rho^{\text {surr }}\right) 之间的差异更糟,这个差异可以仅从 λ opt λ opt  lambda^("opt ")\lambda^{\text {opt }} 中计算得出。如果差距足够小,那么在所有实际情况下,“最优”解就是 λ opt λ opt  lambda^("opt ")\lambda^{\text {opt }}


31.4.1.4.2 数值示例-单光子态层析成像


图 31.13 显示了一个用于单光子量子态(密度矩阵) ρ ρ rho\rho 的状态层析仪的示意图。该装置有两个光子计数探测器,A 和 B。对于四分之一波(q)板和半波板 ( h ) ( h ) (h)(h) ,有两个连续变量设置。

图 31.13 单光子探测器。


这些是可以调整以改变光的偏振的设备。对于角度参数 ( q , h ) ( q , h ) (q,h)(q, h) 的任何设置,每个臂中的一个探测器都会注册一个光子。目标是确定这些参数的最佳设置以及每个设置的实验次数,以使用来自两个探测器的光子计数作为数据来估计状态 ρ ρ rho\rho 。由于光子源并不完全有效,输入的量子状态实际上由一个或零个光子组成。探测器根据光子是否照射到它们上来注册 0 或 1。

假设输入状态始终是一个光子,从不为零,并且每个探测器的效率为 η , 0 η 1 η , 0 η 1 eta,0 <= eta <= 1\eta, 0 \leq \eta \leq 1 ,且有非零的暗计数概率 δ , 0 δ 1 δ , 0 δ 1 delta,0 <= delta <= 1\delta, 0 \leq \delta \leq 1 。因此, 1 η 1 η 1-eta1-\eta 是未检测到的概率, 1 δ 1 δ 1-delta1-\delta 是没有暗计数的概率。在这些条件下,探测器 A , B A , B A,BA, B 有四种可能的结果,用双重索引 α { 10 , 01 , 00 , 11 } α { 10 , 01 , 00 , 11 } alpha in{10,01,00,11}\alpha \in\{10,01,00,11\} 表示。对于纯态和混合态输入,获得了最佳实验分布。
ρ pure = 1 2 [ 1 1 1 1 ] = ψ 0 ψ 0 , ψ 0 = 1 2 [ 1 1 ] , ρ mixd = [ 0.6 0.2 i 0.2 i 0.4 ] ρ pure  = 1 2 1 1 1 1 = ψ 0 ψ 0 , ψ 0 = 1 2 1 1 , ρ mixd  = 0.6 0.2 i 0.2 i 0.4 rho_("pure ")=(1)/(2)[[1,1],[1,1]]=psi_(0)psi_(0)^(†),quadpsi_(0)=(1)/(sqrt2)[[1],[1]],quadrho_("mixd ")=[[0.6,-0.2 i],[0.2 i,0.4]]\rho_{\text {pure }}=\frac{1}{2}\left[\begin{array}{ll} 1 & 1 \\ 1 & 1 \end{array}\right]=\psi_{0} \psi_{0}^{\dagger}, \quad \psi_{0}=\frac{1}{\sqrt{2}}\left[\begin{array}{l} 1 \\ 1 \end{array}\right], \quad \rho_{\text {mixd }}=\left[\begin{array}{cc} 0.6 & -0.2 i \\ 0.2 i & 0.4 \end{array}\right]

我们计算每个输入状态的分布 λ pure, opt λ mixd opt λ pure,  opt  λ mixd  opt lambda_("pure, ")^("opt ")lambda_("mixd ")^(opt)\lambda_{\text {pure, }}^{\text {opt }} \lambda_{\text {mixd }}^{\mathrm{opt}} ,包括和不包括由于探测器效率 η η eta\eta 和暗计数概率 δ δ delta\delta 引起的“噪声”。没有噪声 ( η = 1 , δ = 0 ) ( η = 1 , δ = 0 ) (eta=1,delta=0)(\eta=1, \delta=0) 。有噪声 ( η = 0.75 , δ = ( η = 0.75 , δ = (eta=0.75,delta=(\eta=0.75, \delta= 0.05 ) 0.05 ) 0.05)0.05) 。对于所有情况和噪声条件,我们使用了波片设置。
h i = ( i 1 ) ( 5 ) , i = 1 , , 10 q i = ( i 1 ) ( 5 ) , i = 1 , , 10 h i = ( i 1 ) 5 , i = 1 , , 10 q i = ( i 1 ) 5 , i = 1 , , 10 {:[h_(i)=(i-1)(5^(@))","i=1","dots","10],[q_(i)=(i-1)(5^(@))","i=1","dots","10]:}\begin{aligned} h_{i}=(i-1)\left(5^{\circ}\right), & i=1, \ldots, 10 \\ q_{i}=(i-1)\left(5^{\circ}\right), & i=1, \ldots, 10 \end{aligned}

两个角度从 0 到 45 45 45^(@)45^{\circ} 5 5 5^(@)5^{\circ} 的增量设置。这产生了总共 n cfg = 10 2 = 100 n cfg = 10 2 = 100 n_(cfg)=10^(2)=100n_{\mathrm{cfg}}=10^{2}=100 种配置,对应于所有的波片组合。图 31.14 显示了所有四个测试案例的最佳分布 λ opt λ opt  lambda^("opt ")\lambda^{\text {opt }} 与配置 γ = 1 , , 100 γ = 1 , , 100 gamma=1,dots,100\gamma=1, \ldots, 100 的关系:两种输入状态,分别有噪声和没有噪声。请注意,最佳分布并不均匀,而是集中在相同的特定波片设置附近。

有趣的是,除了没有噪音的纯状态外,OED 和其他分布显示出实验的“分散”。


这导致了更稳健的估计,因为这些 OED 分布可以处理比名义(替代)设计更大的偏差。

为了检查放松的最优 λ opt λ opt  lambda^("opt ")\lambda^{\text {opt }} 与未知整数最优之间的差距,我们参考方程 31.27。下表显示这些分布是一个很好的近似。
expt expt  ℓ_("expt ")\ell_{\text {expt }} V ( expt λ pure opt , ρ pure ) V ( expt round ( ρ pure ) , ρ pure ) V expt  λ pure  opt  , ρ pure  V expt  round  ρ pure  , ρ pure  (V(ℓ_("expt ")lambda_("pure ")^("opt "),rho_("pure ")))/(V(ℓ_("expt ")^("round ")(rho_("pure ")),rho_("pure ")))\frac{V\left(\ell_{\text {expt }} \lambda_{\text {pure }}^{\text {opt }}, \rho_{\text {pure }}\right)}{V\left(\ell_{\text {expt }}^{\text {round }}\left(\rho_{\text {pure }}\right), \rho_{\text {pure }}\right)} V ( expt λ mixd opt , ρ mixd ) V ( expt round ( ρ mixd ) , ρ mixd ) V expt  λ mixd  opt  , ρ mixd  V expt  round  ρ mixd  , ρ mixd  (V(ℓ_("expt ")lambda_("mixd ")^("opt "),rho_("mixd ")))/(V(ℓ_("expt ")^("round ")(rho_("mixd ")),rho_("mixd ")))\frac{V\left(\ell_{\text {expt }} \lambda_{\text {mixd }}^{\text {opt }}, \rho_{\text {mixd }}\right)}{V\left(\ell_{\text {expt }}^{\text {round }}\left(\rho_{\text {mixd }}\right), \rho_{\text {mixd }}\right)}
100 0.9797 0.7761
1000 0.9950 0.9735
10,000 0.9989 0.9954
ℓ_("expt ") (V(ℓ_("expt ")lambda_("pure ")^("opt "),rho_("pure ")))/(V(ℓ_("expt ")^("round ")(rho_("pure ")),rho_("pure "))) (V(ℓ_("expt ")lambda_("mixd ")^("opt "),rho_("mixd ")))/(V(ℓ_("expt ")^("round ")(rho_("mixd ")),rho_("mixd "))) 100 0.9797 0.7761 1000 0.9950 0.9735 10,000 0.9989 0.9954| $\ell_{\text {expt }}$ | $\frac{V\left(\ell_{\text {expt }} \lambda_{\text {pure }}^{\text {opt }}, \rho_{\text {pure }}\right)}{V\left(\ell_{\text {expt }}^{\text {round }}\left(\rho_{\text {pure }}\right), \rho_{\text {pure }}\right)}$ | $\frac{V\left(\ell_{\text {expt }} \lambda_{\text {mixd }}^{\text {opt }}, \rho_{\text {mixd }}\right)}{V\left(\ell_{\text {expt }}^{\text {round }}\left(\rho_{\text {mixd }}\right), \rho_{\text {mixd }}\right)}$ | | :--- | :---: | :---: | | 100 | 0.9797 | 0.7761 | | 1000 | 0.9950 | 0.9735 | | 10,000 | 0.9989 | 0.9954 |

图 31.14 OED 波片分布。


未知的最优整数解对于两个状态的无噪声情况,即使不是很大 expt expt  ℓ_("expt ")\ell_{\text {expt }} 。在有噪声的情况下也得到了类似的结果。


量子过程层析 31.4.2


QPT 指的是使用测量数据来估计量子过程的 OSR 元素[45,48]。因此,QPT 是一种表征几乎任何量子系统动态的方法。


对于量子信息系统而言,量子过程 tomography(QPT)是一种确定系统是否按预期运行的方法。QPT 还可以用来估计特定的系统错误,然后通过针对这些错误的最佳纠错来减轻这些错误。

 31.4.2.1 收集数据


收集 QPT 数据的设置类似于图 31.11 所示的图 31.15。


状态层析(图 31.11)和过程层析(图 31.15)之间的主要区别在于,这里输入状态是已知的,并在特定值 ρ γ ρ γ rho_(gamma)\rho_{\gamma} 下准备,取决于配置 ( γ ) ( γ ) (gamma)(\gamma) ,而要估计的 Q Q QQ -系统则不依赖于配置。图 31.16

图 31.15 系统/POVM。

双原子分子系统
 电子跃迁

来自荧光测量振动的信号

图 31.16 实验室中的 QPT。二原子分子中振动波包的过程层析成像。


显示了牛津 Clarendon 实验室中 QPT 设置的示意图。所示的“X”是过程矩阵(定义见下文),该矩阵将从荧光数据中估计得出[52]。

 31.4.2.2 OSR 模型


至于 QST,如果 Q Q QQ 被建模为一个包含元素 { K k } K k {K_(k)}\left\{K_{k}\right\} 的 OSR,那么模型概率结果是 OSR 元素的二次函数,即,
p α γ ( ρ ) = Tr O α γ ρ , O α γ = k = 1 κ K k M α γ K k , k = 1 κ K k K k = I p α γ ( ρ ) = Tr O α γ ρ , O α γ = k = 1 κ K k M α γ K k , k = 1 κ K k K k = I p_(alpha gamma)(rho)=TrO_(alpha gamma)rho,quadO_(alpha gamma)=sum_(k=1)^(kappa)K_(k)^(†)M_(alpha gamma)K_(k),quadsum_(k=1)^(kappa)K_(k)^(†)K_(k)=Ip_{\alpha \gamma}(\rho)=\operatorname{Tr} O_{\alpha \gamma} \rho, \quad O_{\alpha \gamma}=\sum_{k=1}^{\kappa} K_{k}^{\dagger} M_{\alpha \gamma} K_{k}, \quad \sum_{k=1}^{\kappa} K_{k}^{\dagger} K_{k}=I

此外,OSR 元素的数量并不总是已知的。为了解决这些困难,标准方法是将 OSR 元素表示为 C n × n C n × n C^(n xx n)\mathbf{C}^{n \times n} 的矩阵基,即,
{ B i C n × n i = 1 , , n 2 } K k = i = 1 n 2 x k i B i , k = 1 , , κ B i C n × n i = 1 , , n 2 K k = i = 1 n 2 x k i B i , k = 1 , , κ {B_(i)inC^(n xx n)∣i=1,dots,n^(2)}=>K_(k)=sum_(i=1)^(n^(2))x_(ki)B_(i),k=1,dots,kappa\left\{B_{i} \in \mathbf{C}^{n \times n} \mid i=1, \ldots, n^{2}\right\} \Rightarrow K_{k}=\sum_{i=1}^{n^{2}} x_{k i} B_{i}, k=1, \ldots, \kappa

n 2 n 2 n^(2)n^{2} 系数 { x k i } x k i {x_(ki)}\left\{x_{k i}\right\} 是复标量。引入矩阵 X C n 2 × n 2 X C n 2 × n 2 X inC^(n^(2)xxn^(2))X \in \mathbf{C}^{n^{2} \times n^{2}} ,通常称为过程矩阵,其元素为
X i j = k = 1 κ x k i x k j , i , j = 1 , , n 2 X i j = k = 1 κ x k i x k j , i , j = 1 , , n 2 X_(ij)=sum_(k=1)^(kappa)x_(ki)^(**)x_(kj),quad i,j=1,dots,n^(2)X_{i j}=\sum_{k=1}^{\kappa} x_{k i}^{*} x_{k j}, \quad i, j=1, \ldots, n^{2}

保持迹的条件变为
i , j = 1 n 2 X i j B i B j = I n i , j = 1 n 2 X i j B i B j = I n sum_(i,j=1)^(n^(2))X_(ij)B_(i)^(†)B_(j)=I_(n)\sum_{i, j=1}^{n^{2}} X_{i j} B_{i}^{\dagger} B_{j}=I_{n}

这是一个在 X X XX 中的线性约束。结果概率(方程 31.30)现在变为
p α γ ( X ) = Tr X R α γ , [ R α γ ] i j = Tr B j ρ γ B i O α γ , i , j = 1 , , n 2 p α γ ( X ) = Tr X R α γ , R α γ i j = Tr B j ρ γ B i O α γ , i , j = 1 , , n 2 p_(alpha gamma)(X)=Tr XR_(alpha gamma),quad[R_(alpha gamma)]_(ij)=TrB_(j)rho_(gamma)B_(i)^(†)O_(alpha gamma),quad i,j=1,dots,n^(2)p_{\alpha \gamma}(X)=\operatorname{Tr} X R_{\alpha \gamma}, \quad\left[R_{\alpha \gamma}\right]_{i j}=\operatorname{Tr} B_{j} \rho_{\gamma} B_{i}^{\dagger} O_{\alpha \gamma}, \quad i, j=1, \ldots, n^{2}

QPT 然后从数据集 D D DD 估计 X C n 2 × n 2 X C n 2 × n 2 X inC^(n^(2)xxn^(2))X \in \mathbf{C}^{n^{2} \times n^{2}} (方程 31.14),受二次等式约束(方程 31.32)和线性等式约束(方程 31.33)。通过将二次等式约束(方程 31.32)放宽为半正定约束 X 0 X 0 X >= 0X \geq 0 ,我们可以通过求解 X X XX 来获得放宽的最大似然估计。
minimize L ( D , X ) = α , γ n α γ log Tr X R α γ subject to X 0 , i j X i j B i B j = I n minimize L ( D , X ) = α , γ n α γ log Tr X R α γ  subject to  X 0 , i j X i j B i B j = I n {:[minimize,L(D","X)=-sum_(alpha,gamma)n_(alpha gamma)log Tr XR_(alpha gamma)],[" subject to ",X >= 0","quadsum_(ij)X_(ij)B_(i)^(†)B_(j)=I_(n)]:}\begin{array}{ll} \operatorname{minimize} & L(D, X)=-\sum_{\alpha, \gamma} n_{\alpha \gamma} \log \operatorname{Tr} X R_{\alpha \gamma} \\ \text { subject to } & X \geq 0, \quad \sum_{i j} X_{i j} B_{i}^{\dagger} B_{j}=I_{n} \end{array}

类似地,放松的最小二乘估计是以下方程的解:
minimize V ( D , X ) = α , γ [ p α γ emp Tr X R α γ ] 2 subject to X 0 , i j X i j B i B j = I n . minimize V ( D , X ) = α , γ p α γ emp Tr X R α γ 2  subject to  X 0 , i j X i j B i B j = I n . {:[minimize,V(D","X)=sum_(alpha,gamma)[p_(alpha gamma)^(emp)-Tr XR_(alpha gamma)]^(2)],[" subject to ",X >= 0","quadsum_(ij)X_(ij)B_(i)^(†)B_(j)=I_(n).]:}\begin{array}{ll} \operatorname{minimize} & V(D, X)=\sum_{\alpha, \gamma}\left[p_{\alpha \gamma}^{\mathrm{emp}}-\operatorname{Tr} X R_{\alpha \gamma}\right]^{2} \\ \text { subject to } & X \geq 0, \quad \sum_{i j} X_{i j} B_{i}^{\dagger} B_{j}=I_{n} . \end{array}

这两个问题本质上与方程 31.20 和 31.22 的形式相同。因此,这两个都是凸优化问题,这里的优化变量是矩阵 X X XX 的元素。由于 X = X C n 2 × n 2 X = X C n 2 × n 2 X=X^(†)inC^(n^(2)xxn^(2))X=X^{\dagger} \in \mathbf{C}^{n^{2} \times n^{2}} ,它可以用 n 4 n 4 n^(4)n^{4} 个实变量进行参数化。考虑到 n 2 n 2 n^(2)n^{2} 个实线性等式约束, X X XX 中的自由(实)变量数量因此为 n 4 n 2 n 4 n 2 n^(4)-n^(2)n^{4}-n^{2} 。即使对于相对较少的量子比特,这个数量也可能相当大,例如,对于 q = [ 1 , 2 , 3 , 4 ] q = [ 1 , 2 , 3 , 4 ] q=[1,2,3,4]q=[1,2,3,4] 个量子比特, n = 2 q = [ 2 , 4 , 8 , 16 ] n = 2 q = [ 2 , 4 , 8 , 16 ] n=2^(q)=[2,4,8,16]n=2^{q}=[2,4,8,16] n 4 n 2 = [ 12 , 240 , 4032 , 65280 ] n 4 n 2 = [ 12 , 240 , 4032 , 65280 ] n^(4)-n^(2)=[12,240,4032,65280]n^{4}-n^{2}=[12,240,4032,65280] 。这种指数(在量子比特中)增长是使用这种方法的主要缺点。

过程矩阵 X X XX 可以通过奇异值分解 (SVD) 转换回 OSR。具体来说,设 X = V S V X = V S V X=VSV^(†)X=V S V^{\dagger} 具有单位 V C n 2 × n 2 V C n 2 × n 2 V inC^(n^(2)xxn^(2))V \in \mathbf{C}^{n^{2} \times n^{2}} S = diag ( s 1 s n 2 ) S = diag s 1 s n 2 S=diag(s_(1)dotss_(n^(2)))S=\operatorname{diag}\left(s_{1} \ldots s_{n^{2}}\right) ,奇异值按 s 1 s 2 s n 2 0 s 1 s 2 s n 2 0 s_(1) >= s_(2) >= cdots >= s_(n^(2)) >= 0s_{1} \geq s_{2} \geq \cdots \geq s_{n^{2}} \geq 0 的顺序排列。那么 OSR 元素在这个基表示中的系数为
x k i = s k V i k , k , i = 1 , , n 2 x k i = s k V i k , k , i = 1 , , n 2 x_(ki)=sqrt(s_(k))V_(ik)^(**),quad k,i=1,dots,n^(2)x_{k i}=\sqrt{s_{k}} V_{i k}^{*}, \quad k, i=1, \ldots, n^{2}

由于我们现在可以从放松的优化中恢复出一个 OSR(方程 31.35 或方程 31.36),我们实际上已经找到了最优解,也就是说,放松的解是最优的。

不幸的是,正如前面提到的,参数空间 ( n 4 n 2 ) n 4 n 2 (n^(4)-n^(2))\left(n^{4}-n^{2}\right) 的维度可能会严重消耗资源,达到不切实际的程度。为了更清楚地看到这一点,设方程 31.34 中 n out n cfg n out  n cfg  n_("out ")n_("cfg ")n_{\text {out }} n_{\text {cfg }} 模型概率结果与 n 4 n 4 n^(4)n^{4} 过程矩阵元素之间的线性关系由一个 n out n cfg × n 4 n out  n cfg  × n 4 n_("out ")n_("cfg ")xxn^(4)n_{\text {out }} n_{\text {cfg }} \times n^{4} 矩阵 G G G\mathcal{G} 表示,即,
vec ( P ) = G v e c ( X ) vec ( P ) = G v e c ( X ) vec(P)=Gvec(X)\operatorname{vec}(P)=\mathcal{G} \mathbf{v e c}(X)

其中 vec ( P ) , v e c ( X ) vec ( P ) , v e c ( X ) vec(P),vec(X)\operatorname{vec}(P), \mathbf{v e c}(X) 是由 p i k p i k p_(ik)p_{i k} X X XX 的元素分别形成的向量。考虑到方程 31.33 中的 n 2 n 2 n^(2)n^{2} 线性约束, X X XX 可以通过使用足够多的重复实验( expt expt  ℓ_("expt ")\ell_{\text {expt }} )从方程 31.35 或方程 31.36 中恢复到任何所需的精度,前提是 rank ( G ) n out n cfg n 4 n 2 rank ( G ) n out  n cfg n 4 n 2 rank(G) >= n_("out ")n_(cfg) >= n^(4)-n^(2)\operatorname{rank}(\mathcal{G}) \geq n_{\text {out }} n_{\mathrm{cfg}} \geq n^{4}-n^{2} 。因此,实验资源 n out n cfg n out  n cfg n_("out ")n_(cfg)n_{\text {out }} n_{\mathrm{cfg}} 也必须随着量子比特数量呈指数级增长。再一次,这对即使是适度规模的系统来说也是 QPT 的祸根。


31.4.2.3 稀疏过程矩阵

Is is often the case that the process matrix is sparse or almost sparse, that is, it consists of a small number of significant elements. In some cases, a known sparsity pattern can arise from the underlying dynamics, thereby inherently increasing QPT efficiency [85].
过程矩阵通常是稀疏或几乎稀疏的,即它由少量显著元素组成。在某些情况下,已知的稀疏模式可以源于潜在的动态,从而固有地提高量子过程 tomography(QPT)的效率 [85]。

In most cases, however, the sparsity pattern is not known. In this more common case we can apply the methods of CS [53-55]. Specifically, for a class of incomplete linear measurement equations ( y = A x , A R m × N , m N y = A x , A R m × N , m N y=Ax,A inR^(m xx N),m≪Ny=A x, A \in \mathbf{R}^{m \times N}, m \ll N ), constrained 1 1 ℓ_(1)\ell_{1}-norm minimization (minimize x 1 x 1 ||x||_(ℓ_(1))\|x\|_{\ell_{1}} subject to y = A x y = A x y=Axy=A x ), a convex optimization problem can perfectly estimate the sparse variable x x xx. These methods are also robust to measurement noise and for almost sparse variables.
然而,在大多数情况下,稀疏模式是未知的。在这种更常见的情况下,我们可以应用压缩感知的方法[53-55]。具体来说,对于一类不完整的线性测量方程( y = A x , A R m × N , m N y = A x , A R m × N , m N y=Ax,A inR^(m xx N),m≪Ny=A x, A \in \mathbf{R}^{m \times N}, m \ll N ),约束 1 1 ℓ_(1)\ell_{1} -范数最小化(最小化 x 1 x 1 ||x||_(ℓ_(1))\|x\|_{\ell_{1}} ,满足 y = A x y = A x y=Axy=A x ),一个凸优化问题可以完美地估计稀疏变量 x x xx 。这些方法对测量噪声也具有鲁棒性,并且适用于几乎稀疏的变量。
For a quantum information system the ideal quantum logic gates are unitaries, that is, Q ( ρ ) = U ρ U Q ( ρ ) = U ρ U Q(rho)=U rhoU^(†)Q(\rho)=U \rho U^{\dagger}. Let { B ¯ α C n 2 × n 2 , α = 1 , , n 2 } B ¯ α C n 2 × n 2 , α = 1 , , n 2 { bar(B)_(alpha)inC^(n^(2)xxn^(2)),alpha=1,dots,n^(2)}\left\{\bar{B}_{\alpha} \in \mathbf{C}^{n^{2} \times n^{2}}, \alpha=1, \ldots, n^{2}\right\} denote the “Natural-Basis,” that is, each basis matrix has a single nonzero element of one. In this basis, the process matrix associated with the ideal unitary channel has the rank-1 form, X nat = x x X nat  = x x X_("nat ")=xx^(†)X_{\text {nat }}=x x^{\dagger} with x C n 2 , x x = n x C n 2 , x x = n x inC^(n^(2)),x^(†)x=nx \in \mathbf{C}^{n^{2}}, x^{\dagger} x=n. A SVD gives X nat = V diag ( n , 0 , , 0 ) V X nat  = V diag ( n , 0 , , 0 ) V X_("nat ")=V diag(n,0,dots,0)V^(†)X_{\text {nat }}=V \operatorname{diag}(n, 0, \ldots, 0) V^{\dagger} with V C n 2 × n 2 V C n 2 × n 2 V inC^(n^(2)xxn^(2))V \in \mathbf{C}^{n^{2} \times n^{2}} a
对于量子信息系统,理想的量子逻辑门是单位算子,即 Q ( ρ ) = U ρ U Q ( ρ ) = U ρ U Q(rho)=U rhoU^(†)Q(\rho)=U \rho U^{\dagger} 。让 { B ¯ α C n 2 × n 2 , α = 1 , , n 2 } B ¯ α C n 2 × n 2 , α = 1 , , n 2 { bar(B)_(alpha)inC^(n^(2)xxn^(2)),alpha=1,dots,n^(2)}\left\{\bar{B}_{\alpha} \in \mathbf{C}^{n^{2} \times n^{2}}, \alpha=1, \ldots, n^{2}\right\} 表示“自然基”,即每个基矩阵只有一个非零元素为一。在这个基中,与理想单位通道相关的过程矩阵具有秩为 1 的形式 X nat = x x X nat  = x x X_("nat ")=xx^(†)X_{\text {nat }}=x x^{\dagger} ,并且 x C n 2 , x x = n x C n 2 , x x = n x inC^(n^(2)),x^(†)x=nx \in \mathbf{C}^{n^{2}}, x^{\dagger} x=n 。奇异值分解(SVD)给出 X nat = V diag ( n , 0 , , 0 ) V X nat  = V diag ( n , 0 , , 0 ) V X_("nat ")=V diag(n,0,dots,0)V^(†)X_{\text {nat }}=V \operatorname{diag}(n, 0, \ldots, 0) V^{\dagger} ,并且 V C n 2 × n 2 V C n 2 × n 2 V inC^(n^(2)xxn^(2))V \in \mathbf{C}^{n^{2} \times n^{2}}

unitary. An equivalent process matrix can be formed from the SVD in what is referred to here as the “SVD-Basis,” { B α = α = 1 n S 2 V α α B ¯ α , α = 1 , , n 2 } B α = α = 1 n S 2 V α α B ¯ α , α = 1 , , n 2 {B_(alpha)=sum_(alpha^(')=1)^(n_(S)^(2))V_(alpha^(')alpha) bar(B)_(alpha^(')),alpha=1,dots,n^(2)}\left\{B_{\alpha}=\sum_{\alpha^{\prime}=1}^{n_{S}^{2}} V_{\alpha^{\prime} \alpha} \bar{B}_{\alpha^{\prime}}, \alpha=1, \ldots, n^{2}\right\}. The equivalent process matrix for a unitary channel, in this basis, denoted by X svd X svd  X_("svd ")X_{\text {svd }}, is maximally sparse with a single nonzero element, specifically, ( X nat ) 11 = n X nat  11 = n (X_("nat "))_(11)=n\left(X_{\text {nat }}\right)_{11}=n. The actual channel which interacts with an environment will be a perturbation of the ideal unitary. If the noise source is small, then the process matrix in the nominal basis will be almost sparse.
单位。可以从奇异值分解(SVD)形成一个等效的过程矩阵,这里称为“SVD 基”, { B α = α = 1 n S 2 V α α B ¯ α , α = 1 , , n 2 } B α = α = 1 n S 2 V α α B ¯ α , α = 1 , , n 2 {B_(alpha)=sum_(alpha^(')=1)^(n_(S)^(2))V_(alpha^(')alpha) bar(B)_(alpha^(')),alpha=1,dots,n^(2)}\left\{B_{\alpha}=\sum_{\alpha^{\prime}=1}^{n_{S}^{2}} V_{\alpha^{\prime} \alpha} \bar{B}_{\alpha^{\prime}}, \alpha=1, \ldots, n^{2}\right\} 。在这个基中,单位通道的等效过程矩阵用 X svd X svd  X_("svd ")X_{\text {svd }} 表示,具有最大稀疏性,只有一个非零元素,具体为 ( X nat ) 11 = n X nat  11 = n (X_("nat "))_(11)=n\left(X_{\text {nat }}\right)_{11}=n 。与环境相互作用的实际通道将是理想单位的一个扰动。如果噪声源很小,那么名义基中的过程矩阵将几乎是稀疏的。
As an example, consider a system which is ideally a two-qubit ( n = 4 ) ( n = 4 ) (n=4)(n=4) quantum memory, thus U = I 4 U = I 4 U=I_(4)U=I_{4}. Suppose the actual system is a perturbation of identity by independent bit-flip errors in each channel occurring with probability p bf p bf p_(bf)p_{\mathrm{bf}}. For p bf = 0.05 p bf = 0.05 p_(bf)=0.05p_{\mathrm{bf}}=0.05 and p bf = 0.2 p bf = 0.2 p_(bf)=0.2p_{\mathrm{bf}}=0.2, the respective channel fidelities are about 0.90 and 0.64 , which for quantum information processing would need to be discovered by QPT and then corrected for the device to ever work. Referring to Figure 31.17, in the Natural-Basis, the ideal 16 × 16 16 × 16 16 xx1616 \times 16 process matrix has 16 nonzero elements out of 256 , all of magnitude one. Using the SVD-Basis, the corresponding process matrix as shown in Figure 31.17b has a single nonzero element of magnitude
作为一个例子,考虑一个理想的两量子比特 ( n = 4 ) ( n = 4 ) (n=4)(n=4) 量子存储系统,因此 U = I 4 U = I 4 U=I_(4)U=I_{4} 。假设实际系统是通过每个通道中以概率 p bf p bf p_(bf)p_{\mathrm{bf}} 发生的独立比特翻转错误对身份的扰动。对于 p bf = 0.05 p bf = 0.05 p_(bf)=0.05p_{\mathrm{bf}}=0.05 p bf = 0.2 p bf = 0.2 p_(bf)=0.2p_{\mathrm{bf}}=0.2 ,相应的通道保真度约为 0.90 和 0.64,这对于量子信息处理需要通过量子过程 tomography(QPT)发现,然后进行纠正,以使设备能够正常工作。参考图 31.17,在自然基中,理想的 16 × 16 16 × 16 16 xx1616 \times 16 过程矩阵在 256 个元素中有 16 个非零元素,所有元素的大小为 1。使用 SVD 基,图 31.17b 所示的相应过程矩阵具有一个大小为的单个非零元素。
FIGURE 31.17 Absolute values of the elements of the process matrix X C 16 × 16 X C 16 × 16 X inC^(16 xx16)X \in \mathbf{C}^{16 \times 16} for: (a) Ideal (unitary) in NaturalBasis; (b) Ideal (unitary) in SVD-Basis; © Actual ( p bf = 0.05 p bf = 0.05 p_(bf)=0.05p_{\mathrm{bf}}=0.05 ) in Natural-Basis; (d) Actual ( p bf = 0.05 p bf = 0.05 p_(bf)=0.05p_{\mathrm{bf}}=0.05 ) in SVD-Basis; (e) actual ( p bf = 0.2 ) p bf  = 0.2 (p_("bf ")=0.2)\left(p_{\text {bf }}=0.2\right) in Natural-Basis; (f) Actual ( p bf = 0.2 ) p bf  = 0.2 (p_("bf ")=0.2)\left(p_{\text {bf }}=0.2\right) in SVD-Basis.
图 31.17 过程矩阵 X C 16 × 16 X C 16 × 16 X inC^(16 xx16)X \in \mathbf{C}^{16 \times 16} 的元素的绝对值: (a) 自然基中的理想(单位); (b) SVD 基中的理想(单位); (c) 自然基中的实际( p bf = 0.05 p bf = 0.05 p_(bf)=0.05p_{\mathrm{bf}}=0.05 ); (d) SVD 基中的实际( p bf = 0.05 p bf = 0.05 p_(bf)=0.05p_{\mathrm{bf}}=0.05 ); (e) 自然基中的实际 ( p bf = 0.2 ) p bf  = 0.2 (p_("bf ")=0.2)\left(p_{\text {bf }}=0.2\right) ; (f) SVD 基中的实际 ( p bf = 0.2 ) p bf  = 0.2 (p_("bf ")=0.2)\left(p_{\text {bf }}=0.2\right)


n = 4 n = 4 n=4n=4 -它显然是最大程度的稀疏。图 31.17 c f 31.17 c f 31.17c-f31.17 \mathrm{c}-\mathrm{f} 分别显示了两个 p bf p bf  p_("bf ")p_{\text {bf }} 级别在两个基集中的效果。在 SVD 基集中,图 31.17d 和 f 显示实际(噪声)过程矩阵几乎是稀疏的。

 31.4.2.4 通过 CS 的 QPT


一种已知的启发式方法是在不知道稀疏模式的情况下最小化稀疏性,同时利用更少的资源带来的好处,即最小化变量向量的 1 1 ℓ_(1)\ell_{1} -范数[49,53,55]。对于 QPT,相应的 1 1 ℓ_(1)\ell_{1} 范数在此定义为过程矩阵元素绝对值的总和。具体而言,可以通过解决以下凸优化问题来获得 X X XX 的估计。

minimize v e c ( X ) 1 = α , β = 1 n 2 | X α β | minimize v e c ( X ) 1 = α , β = 1 n 2 X α β minimize quad||vec(X)||_(ℓ_(1))=sum_(alpha,beta=1)^(n^(2))|X_(alpha beta)|\operatorname{minimize} \quad\|\mathbf{v e c}(X)\|_{\ell_{1}}=\sum_{\alpha, \beta=1}^{n^{2}}\left|X_{\alpha \beta}\right|
 受制于 V ( X ) = v e c ( P emp ) G v e c ( X ) 2 σ , X 0 , i j X i j B i B j = I n V ( X ) = v e c P emp G v e c ( X ) 2 σ , X 0 , i j X i j B i B j = I n quad V(X)=||vec(P^(emp))-Gvec(X)||_(ℓ_(2)) <= sigma,quad X >= 0,quadsum_(ij)X_(ij)B_(i)^(†)B_(j)=I_(n)\quad V(X)=\left\|\mathbf{v e c}\left(P^{\mathrm{emp}}\right)-\mathcal{G} \mathbf{v e c}(X)\right\|_{\ell_{2}} \leq \sigma, \quad X \geq 0, \quad \sum_{i j} X_{i j} B_{i}^{\dagger} B_{j}=I_{n}

如[57]所示,如果 G G G\mathcal{G} 是一个满足“集中不等式”的随机矩阵,并且如果 V ( X ) σ V ( X ) σ V(X) <= sigmaV(X) \leq \sigma ,那么在高概率下,来自方程 31.39 的最优估计 X X X^(***)X^{\star} 与真实过程矩阵 X true X true  X_("true ")X_{\text {true }} 之间的误差的规模为
vec ( X X true ) 2 = O ( 1 s vec ( X true ( s ) X true ) 1 ) + O ( δ ) vec X X true  2 = O 1 s vec X true  ( s ) X true  1 + O ( δ ) ||vec(X^(***)-X_("true "))||_(ℓ_(2))=O((1)/(sqrts)||vec(X_("true ")(s)-X_("true "))||_(1))+O(delta)\left\|\operatorname{vec}\left(X^{\star}-X_{\text {true }}\right)\right\|_{\ell_{2}}=\mathcal{O}\left(\frac{1}{\sqrt{s}}\left\|\operatorname{vec}\left(X_{\text {true }}(s)-X_{\text {true }}\right)\right\|_{1}\right)+\mathcal{O}(\delta)

前提是 n out n cfg = O ( s log ( n 4 / s ) ) n out  n cfg  = O s log n 4 / s n_("out ")n_("cfg ")=O(s log(n^(4)//s))n_{\text {out }} n_{\text {cfg }}=\mathcal{O}\left(s \log \left(n^{4} / s\right)\right) 。在这里, X true ( s ) X true  ( s ) X_("true ")(s)X_{\text {true }}(s) X true X true  X_("true ")X_{\text {true }} 的最佳 s s ss -稀疏近似;前者当然是未知的。因此,如果 X true X true  X_("true ")X_{\text {true }} 确实是 s s ss -稀疏且没有噪声( σ = 0 σ = 0 sigma=0\sigma=0 ),那么真实的过程矩阵以高概率被完美恢复。

在实际应用中,方程 31.39 中的参数 σ σ sigma\sigma 用于调节通过最小化 V ( X ) V ( X ) V(X)V(X) 来拟合 X X XX 与数据之间的权衡, versus 通过 1 1 ℓ_(1)\ell_{1} -范数最小化 X X XX 的稀疏性。选择 σ σ sigma\sigma 通常是通过对从预期场景中获得的 X X XX 的一系列替代品的 V ( X ) V ( X ) V(X)V(X) 进行平均来完成的。


31.4.2.4.1 数值示例 - 噪声两量子比特存储的量子相位传输


在每个示例中,遵循 QPT 的程序是:(1) 使用完整的测量集求解方程 31.36 以获得 X 2 ; X 2 ; X_(ℓ_(2));X_{\ell_{2}} ; (2) 设置 σ = 1.3 V ( X 2 ) ; σ = 1.3 V X 2 ; sigma=1.3 V(X_(ℓ_(2)));\sigma=1.3 V\left(X_{\ell_{2}}\right) ; (3) 求解方程 31.39 以获得 X 1 X 1 X_(ℓ_(1))X_{\ell_{1}}

对于图 31.17 中的示例系统,输入和测量从两量子比特状态的集合中选择: | a , | + = ( | a + | b ) / 2 , | = ( | a i | b ) / 2 | a , | + = ( | a + | b ) / 2 , | = ( | a i | b ) / 2 |a:),|+:)=(|a:)+|b:))//sqrt2,|-:)=(|a:)-i|b:))//sqrt2|a\rangle,|+\rangle=(|a\rangle+|b\rangle) / \sqrt{2},|-\rangle=(|a\rangle-i|b\rangle) / \sqrt{2} a , b = 1 , , 16 a , b = 1 , , 16 a,b=1,dots,16a, b=1, \ldots, 16 。具体来说,可用的状态集合是矩阵的 16 列。
[ 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 ] , 1 2 [ 1 1 1 0 0 0 1 0 0 1 1 0 0 1 0 1 0 1 0 0 1 0 1 1 ] , and 1 2 [ 1 1 1 0 0 0 i 0 0 1 1 0 0 i 0 i 0 1 0 0 i 0 i i ] 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 , 1 2 1 1 1 0 0 0 1 0 0 1 1 0 0 1 0 1 0 1 0 0 1 0 1 1 ,  and  1 2 1 1 1 0 0 0 i 0 0 1 1 0 0 i 0 i 0 1 0 0 i 0 i i [[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]],(1)/(sqrt2)[[1,1,1,0,0,0],[1,0,0,1,1,0],[0,1,0,1,0,1],[0,0,1,0,1,1]],quad" and "quad(1)/(sqrt2)[[1,1,1,0,0,0],[-i,0,0,1,1,0],[0,-i,0,-i,0,1],[0,0,-i,0,-i,-i]]\left[\begin{array}{llll} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{array}\right], \frac{1}{\sqrt{2}}\left[\begin{array}{cccccc} 1 & 1 & 1 & 0 & 0 & 0 \\ 1 & 0 & 0 & 1 & 1 & 0 \\ 0 & 1 & 0 & 1 & 0 & 1 \\ 0 & 0 & 1 & 0 & 1 & 1 \end{array}\right], \quad \text { and } \quad \frac{1}{\sqrt{2}}\left[\begin{array}{cccccc} 1 & 1 & 1 & 0 & 0 & 0 \\ -i & 0 & 0 & 1 & 1 & 0 \\ 0 & -i & 0 & -i & 0 & 1 \\ 0 & 0 & -i & 0 & -i & -i \end{array}\right]

考虑到只有重合的输入/测量计数 [86],相关的概率结果(方程 31.34)是
p a b ( X ) = g a b X g a b , X C 16 × 16 ( g a b ) α = ϕ a Γ α ϕ b , α = 1 , , 16 p a b ( X ) = g a b X g a b , X C 16 × 16 g a b α = ϕ a Γ α ϕ b , α = 1 , , 16 {:[p_(ab)(X)=g_(ab)^(†)Xg_(ab)","X inC^(16 xx16)],[(g_(ab))_(alpha)=phi_(a)^(†)Gamma_(alpha)phi_(b)","alpha=1","dots","16]:}\begin{aligned} p_{a b}(X) & =g_{a b}^{\dagger} X g_{a b}, & X \in \mathbf{C}^{16 \times 16} \\ \left(g_{a b}\right)_{\alpha} & =\phi_{a}^{\dagger} \Gamma_{\alpha} \phi_{b}, & \alpha=1, \ldots, 16 \end{aligned}

ϕ a , ϕ b ( a , b ) { 1 , , 16 } ϕ a , ϕ b ( a , b ) { 1 , , 16 } phi_(a),phi_(b)(a,b)in{1,dots,16}\phi_{a}, \phi_{b}(a, b) \in\{1, \ldots, 16\} 方程 31.41 的选定列。


图 31.18 显示了通过 RMS 矩阵范数 Δ X rms = ( 1 / n ) ( Tr Δ X Δ X ) 1 / 2 Δ X rms  = ( 1 / n ) Tr Δ X Δ X 1 / 2 ||Delta X||_("rms ")=(1//n)(Tr DeltaX^(†)Delta X)^(1//2)\|\Delta X\|_{\text {rms }}=(1 / n)\left(\operatorname{Tr} \Delta X^{\dagger} \Delta X\right)^{1 / 2} 测量的过程矩阵 Δ X = X true X est Δ X = X true  X est  Delta X=X_("true ")-X_("est ")\Delta X=X_{\text {true }}-X_{\text {est }} 估计误差与从集合中选择的每个输入的实验数量之间的关系(方程 31.41)。* 显示的结果来自于标题中描述的模拟。

图 31.18 RMS 估计误差 X true X est rms X true  X est  rms  ||X_("true ")-X_("est ")||_("rms ")\left\|X_{\text {true }}-X_{\text {est }}\right\|_{\text {rms }} 与每个配置的实验数量:方程 31.41 的选定列。误差条显示每个设置下 50 次运行的偏差。 2 2 ℓ_(2)\ell_{2} -最小化( \square ): X est = X 2 X est  = X 2 X_("est ")=X_(ℓ_(2))X_{\text {est }}=X_{\ell_{2}} 来自方程 31.36,使用所有 16 个输入/输出组合。这给出了一个矩阵 G C 256 × 256 G C 256 × 256 GinC^(256 xx256)\mathcal{G} \in \mathbf{C}^{256 \times 256} ,如方程 31.38 所定义,具有满秩,即 rank ( G ) = 256 . 1 rank ( G ) = 256 . 1 rank(G)=256.ℓ_(1)\operatorname{rank}(\mathcal{G})=256 . \ell_{1} -最小化 ( ) : X est = X 1 ( ) : X est  = X 1 (diamond):X_("est ")=X_(ℓ_(1))(\diamond): X_{\text {est }}=X_{\ell_{1}} 来自方程 31.39,使用从方程 31.41 第二个矩阵的列中获得的六个输入和六个测量。这给出 G C 36 × 256 G C 36 × 256 GinC^(36 xx256)\mathcal{G} \in \mathbf{C}^{36 \times 256} ,具有满秩,即 rank ( G ) = 36 rank ( G ) = 36 rank(G)=36\operatorname{rank}(\mathcal{G})=36

与标准的 2 2 ℓ_(2)\ell_{2} -最小化相比, 1 1 ℓ_(1)\ell_{1} -最小化的好处在于从高度不完整的测量中获得少量数据时最为明显。例如,对于 p bf = 0.05 p bf = 0.05 p_(bf)=0.05p_{\mathrm{bf}}=0.05 [图 31.18a],在 6 输入/6 输出配置下,每个输入进行 50 × 10 3 50 × 10 3 50 xx10^(3)50 \times 10^{3} 次实验时, 1 1 ℓ_(1)\ell_{1} RMS 估计误差为 0.0019。与此相比,在 16 输入/16 输出配置下,每个输入进行 500 × 10 3 500 × 10 3 500 xx10^(3)500 \times 10^{3} 次实验时, 2 2 ℓ_(2)\ell_{2} 误差为 0.0012( G C 256 × 256 G C 256 × 256 GinC^(256 xx256)\mathcal{G} \in \mathbf{C}^{256 \times 256} )。后者的改进主要归因于每个输入实验次数的 10 倍增加。实现这一点所需的额外资源是显著的,即 2 2 ℓ_(2)\ell_{2} 需要 16 个输入,而 1 1 ℓ_(1)\ell_{1} 只需 6 个输入,此外,总实验次数也从 6 × 50 × 10 3 6 × 50 × 10 3 6xx50 xx10^(3)6 \times 50 \times 10^{3} 增加到 16 × 500 × 10 3 16 × 500 × 10 3 16 xx500 xx10^(3)16 \times 500 \times 10^{3} 。要估计过程矩阵的 240 个参数,显然不完整的测量集仅使用 36 个结果(图 31.18 中的 Δ Δ Delta\Delta )能够产生的结果不仅与全输入情况下的结果相似,而且在每个输入的实验次数上,甚至优于包含所有 256 种输入和测量组合的完整输入情况(图 31.18 中的 \square )。 如所见, 1 1 ℓ_(1)\ell_{1} 错误约为 2 2 ℓ_(2)\ell_{2} 错误的一半。此外,重新加权将(未加权的) 1 1 ℓ_(1)\ell_{1} 错误减少了 1 / 2 1 / 2 1//21 / 2 1 / 3 1 / 3 1//31 / 3

比较估计误差与实际和理想之间的误差(图 31.18 中的实线)表明,每个输入至少需要 50 × 10 3 50 × 10 3 50 xx10^(3)50 \times 10^{3} 次实验,以实现对理想单位的充分后 QPT 误差校正。图 31.18 还显示,对于两种位翻转错误级别,估计误差非常相似, p bf { 0.05 , 0.20 } p bf { 0.05 , 0.20 } p_(bf)in{0.05,0.20}p_{\mathrm{bf}} \in\{0.05,0.20\} 。这可以通过 Cramér-Rao 界限来解释,该界限定义了任何无偏估计量的渐近误差,即 RMS 衰减为 Δ / N Δ / N Delta//sqrtN\Delta / \sqrt{N} 。在这里, Δ Δ Delta\Delta 实际上是经验概率结果与实际概率结果之间的误差,根据定义是一个数量级;这为图 31.18 中的数据提供了合理的拟合。


31.4.2.5 QPT 实验设计


OED 的设置在这里与状态估计(QST)完全类似。让 X surr X surr  X^("surr ")X^{\text {surr }} 成为真实过程矩阵 X true X true  X^("true ")X^{\text {true }} 的替代。相关的(放松的)OED 问题是

 最小化 V ( λ , X surr ) = Tr [ γ λ γ G γ ( X surr ) ] 1 V λ , X surr  = Tr γ λ γ G γ X surr  1 quad V(lambda,X^("surr "))=Tr[sum_(gamma)lambda_(gamma)G_(gamma)(X^("surr "))]^(-1)\quad V\left(\lambda, X^{\text {surr }}\right)=\operatorname{Tr}\left[\sum_{\gamma} \lambda_{\gamma} G_{\gamma}\left(X^{\text {surr }}\right)\right]^{-1}
 受制于 γ λ γ = 1 , λ γ 0 , γ = 1 , , n cfg γ λ γ = 1 , λ γ 0 , γ = 1 , , n cfg  quadsum_(gamma)lambda_(gamma)=1,quadlambda_(gamma) >= 0,gamma=1,dots,n_("cfg ")\quad \sum_{\gamma} \lambda_{\gamma}=1, \quad \lambda_{\gamma} \geq 0, \gamma=1, \ldots, n_{\text {cfg }}
 哪里
G γ ( X surr ) = C eq [ α a α γ a α γ p α γ ( X surrr ) ] C eq , a α γ = vec R α γ C n 4 G γ X surr  = C eq α a α γ a α γ p α γ X surrr  C eq , a α γ = vec R α γ C n 4 G_(gamma)(X^("surr "))=C_(eq)^(†)[sum_(alpha)(a_(alpha gamma)a_(alpha gamma)^(†))/(p_(alpha gamma)(X^("surrr ")))]C_(eq),quada_(alpha gamma)=vecR_(alpha gamma)inC^(n^(4))G_{\gamma}\left(X^{\text {surr }}\right)=C_{\mathrm{eq}}^{\dagger}\left[\sum_{\alpha} \frac{a_{\alpha \gamma} a_{\alpha \gamma}^{\dagger}}{p_{\alpha \gamma}\left(X^{\text {surrr }}\right)}\right] C_{\mathrm{eq}}, \quad a_{\alpha \gamma}=\operatorname{vec} R_{\alpha \gamma} \in \mathbf{C}^{n^{4}}

C eq C n 4 × n 4 n 2 C eq C n 4 × n 4 n 2 C_(eq)inC^(n^(4)xxn^(4)-n^(2))C_{\mathrm{eq}} \in \mathbf{C}^{n^{4} \times n^{4}-n^{2}} n 2 × n 4 n 2 × n 4 n^(2)xxn^(4)n^{2} \times n^{4} 矩阵的 SVD 中的单位矩阵 W = [ C C eq ] C n 4 × n 4 W = C C eq C n 4 × n 4 W=[CC_(eq)]inC^(n^(4)xxn^(4))W=\left[C C_{\mathrm{eq}}\right] \in \mathbf{C}^{n^{4} \times n^{4}} 的一部分
[ a 1 a n 4 ] = U [ n I n 2 0 n 2 × n 4 n 2 ] W a 1 a n 4 = U n I n 2 0 n 2 × n 4 n 2 W [a_(1)dotsa_(n^(4))]=U[[sqrtnI_(n^(2)),0_(n^(2)xxn^(4)-n^(2))]]W^(†)\left[\begin{array}{lll} a_{1} \ldots a_{n^{4}} \end{array}\right]=U\left[\begin{array}{ll} \sqrt{n} I_{n^{2}} & 0_{n^{2} \times n^{4}-n^{2}} \end{array}\right] W^{\dagger}

a k = vec ( B i B j ) C n 2 a k = vec B i B j C n 2 a_(k)=vec(B_(i)^(†)B_(j))inC^(n^(2))a_{k}=\operatorname{vec}\left(B_{i}^{\dagger} B_{j}\right) \in \mathbf{C}^{n^{2}} 相关的 k = i + ( j 1 ) n 2 , i , j = 1 , , n 2 k = i + ( j 1 ) n 2 , i , j = 1 , , n 2 k=i+(j-1)n^(2),i,j=1,dots,n^(2)k=i+(j-1) n^{2}, i, j=1, \ldots, n^{2} C eq C eq C_(eq)C_{\mathrm{eq}} 的列,即 W W WW 的最后 n 4 n 2 n 4 n 2 n^(4)-n^(2)n^{4}-n^{2} 列,是 [ a 1 a n 4 ] a 1 a n 4 [a_(1)dotsa_(n^(4))]\left[a_{1} \ldots a_{n^{4}}\right] 的零空间的基。


31.4.3 哈密顿参数估计


31.4.3.1 ML 哈密顿参数估计


量子系统由一个有限维的哈密顿矩阵 H ( t , θ ) C n × n H ( t , θ ) C n × n H(t,theta)inC^(n xx n)H(t, \theta) \in \mathbf{C}^{n \times n} 建模,该矩阵对时间 t , 0 t t f t , 0 t t f t,0 <= t <= t_(f)t, 0 \leq t \leq t_{f} 和一个未知参数向量 θ R n θ θ R n θ theta inR^(n_(theta))\theta \in \mathbf{R}^{n_{\theta}} 具有已知依赖性。模型密度矩阵依赖于 θ θ theta\theta 和从状态集合 { ρ β init C n × n β = 1 , , n in } ρ β init  C n × n β = 1 , , n in  {rho_(beta)^("init ")inC^(n xx n)∣beta=1,dots,n_("in ")}\left\{\rho_{\beta}^{\text {init }} \in \mathbf{C}^{n \times n} \mid \beta=1, \ldots, n_{\text {in }}\right\} 中抽取的初始(准备好的且已知的)状态。因此,与初始状态 ρ β init ρ β init  rho_(beta)^("init ")\rho_{\beta}^{\text {init }} 相关的密度矩阵是 ρ β ( t , θ ) ρ β ( t , θ ) rho_(beta)(t,theta)in\rho_{\beta}(t, \theta) \in C n × n C n × n C^(n xx n)\mathbf{C}^{n \times n} ,其演化遵循
i ρ ˙ β = [ H ( t , θ ) , ρ β ] , ρ β ( 0 , θ ) = ρ β init i ρ ˙ β = H ( t , θ ) , ρ β , ρ β ( 0 , θ ) = ρ β init  iℏrho^(˙)_(beta)=[H(t,theta),rho_(beta)],rho_(beta)(0,theta)=rho_(beta)^("init ")i \hbar \dot{\rho}_{\beta}=\left[H(t, \theta), \rho_{\beta}\right], \rho_{\beta}(0, \theta)=\rho_{\beta}^{\text {init }}
 等价地,
ρ β ( t , θ ) = U ( t , θ ) ρ β init U ( t , θ ) ρ β ( t , θ ) = U ( t , θ ) ρ β init  U ( t , θ ) rho_(beta)(t,theta)=U(t,theta)rho_(beta)^("init ")U(t,theta)^(**)\rho_{\beta}(t, \theta)=U(t, \theta) \rho_{\beta}^{\text {init }} U(t, \theta)^{*}

其中 U ( t , θ ) C n × n U ( t , θ ) C n × n U(t,theta)inC^(n xx n)U(t, \theta) \in \mathbf{C}^{n \times n} 是与 H ( t , θ ) H ( t , θ ) H(t,theta)H(t, \theta) 相关的单位传播子,满足
i U ˙ = H ( t , θ ) U , U ( 0 , θ ) = I n i U ˙ = H ( t , θ ) U , U ( 0 , θ ) = I n iℏU^(˙)=H(t,theta)U,U(0,theta)=I_(n)i \hbar \dot{U}=H(t, \theta) U, U(0, \theta)=I_{n}

在每个 n sa n sa  n_("sa ")n_{\text {sa }} 个样本时间点,时间间隔为 t f t f t_(f)t_{\mathrm{f}} ,记录来自相同重复实验的测量值。具体来说,设 { t τ τ = 1 , , n sa } t τ τ = 1 , , n sa  {t_(tau)∣tau=1,dots,n_("sa ")}\left\{t_{\tau} \mid \tau=1, \ldots, n_{\text {sa }}\right\} 表示相对于每个实验开始的样本时间。设 n α β τ n α β τ n_(alpha beta tau)n_{\alpha \beta \tau} 为在 t τ t τ t_(tau)t_{\tau} 时,初始状态为 ρ β init ρ β init  rho_(beta)^("init ")\rho_{\beta}^{\text {init }} 的情况下,从 β τ β τ ℓ_(beta tau)\ell_{\beta \tau} 个实验中记录到结果 α α alpha\alpha 的次数。因此,数据集由所有结果计数组成。
D = { n α β τ α = 1 , , n out , β = 1 , , n in , τ = 1 , , n sa } D = n α β τ α = 1 , , n out  , β = 1 , , n in  , τ = 1 , , n sa  D={n_(alpha beta tau)∣alpha=1,dots,n_("out "),beta=1,dots,n_("in "),tau=1,dots,n_("sa ")}D=\left\{n_{\alpha \beta \tau} \mid \alpha=1, \ldots, n_{\text {out }}, \beta=1, \ldots, n_{\text {in }}, \tau=1, \ldots, n_{\text {sa }}\right\}

先前由 γ = 1 , , n cfg γ = 1 , , n cfg gamma=1,dots,n_(cfg)\gamma=1, \ldots, n_{\mathrm{cfg}} 列举和标记的配置在这种情况下是输入状态 ρ β init ρ β init  rho_(beta)^("init ")\rho_{\beta}^{\text {init }} 和采样时间 τ τ tau\tau 的组合,因此 n cfg = n in n sa n cfg = n in n sa n_(cfg)=n_(in)n_(sa)n_{\mathrm{cfg}}=n_{\mathrm{in}} n_{\mathrm{sa}} 。对于 POVM M α M α M_(alpha)M_{\alpha} ,每对配置的模型结果概率 ( ρ β in t , t τ ) ρ β in  t , t τ (rho_(beta)^("in "t),t_(tau))\left(\rho_{\beta}^{\text {in } \mathrm{t}}, t_{\tau}\right)
p α β τ ( θ ) = Tr M α ρ β ( t τ , θ ) = Tr O α τ ( θ ) ρ β init O α τ ( θ ) = U ( t τ , θ ) M α U ( t τ , θ ) p α β τ ( θ ) = Tr M α ρ β t τ , θ = Tr O α τ ( θ ) ρ β init  O α τ ( θ ) = U t τ , θ M α U t τ , θ {:[p_(alpha beta tau)(theta)=TrM_(alpha)rho_(beta)(t_(tau),theta)=TrO_(alpha tau)(theta)rho_(beta)^("init ")],[O_(alpha tau)(theta)=U(t_(tau),theta)^(**)M_(alpha)U(t_(tau),theta)]:}\begin{aligned} p_{\alpha \beta \tau}(\theta) & =\operatorname{Tr} M_{\alpha} \rho_{\beta}\left(t_{\tau}, \theta\right)=\operatorname{Tr} O_{\alpha \tau}(\theta) \rho_{\beta}^{\text {init }} \\ O_{\alpha \tau}(\theta) & =U\left(t_{\tau}, \theta\right)^{*} M_{\alpha} U\left(t_{\tau}, \theta\right) \end{aligned}

最大似然估计 θ ML R n θ θ ML R n θ theta^(ML)inR^(n_(theta))\theta^{\mathrm{ML}} \in \mathbf{R}^{n_{\theta}} 是通过优化问题的解得到的
minimize L ( D , θ ) = α , β , τ n α β τ log Tr O α τ ( θ ) ρ β init subject to θ Θ minimize L ( D , θ ) = α , β , τ n α β τ log Tr O α τ ( θ ) ρ β init   subject to  θ Θ {:[minimize,L(D","theta)=-sum_(alpha,beta,tau)n_(alpha beta tau)log TrO_(alpha tau)(theta)rho_(beta)^("init ")],[" subject to ",theta in Theta]:}\begin{array}{ll} \operatorname{minimize} & L(D, \theta)=-\sum_{\alpha, \beta, \tau} n_{\alpha \beta \tau} \log \operatorname{Tr} O_{\alpha \tau}(\theta) \rho_{\beta}^{\text {init }} \\ \text { subject to } & \theta \in \Theta \end{array}

其中 Θ Θ Theta\Theta 是对 θ θ theta\theta 的一组约束。例如,可能已知 θ θ theta\theta 限制在接近名义值的区域内,例如 Θ = { θ θ θ nom δ } Θ = θ θ θ nom  δ Theta={theta∣||theta-theta_("nom ")|| <= delta}\Theta=\left\{\theta \mid\left\|\theta-\theta_{\text {nom }}\right\| \leq \delta\right\} 。尽管这后一组是凸的,但不幸的是,似然函数 L ( D , θ ) L ( D , θ ) L(D,theta)L(D, \theta) θ θ theta\theta 中并不保证是凸的。然而,它在限制区域 Θ Θ Theta\Theta 中可能是凸的,例如,如果 δ δ delta\delta 足够小。


31.4.3.2 哈密顿参数估计的实验设计


尽管哈密顿参数估计不是凸的,但(放松的)实验设计问题是凸的。将克拉美-罗界直接应用于方程 31.51 中的似然函数,得到如下结果。


31.4.3.2.1 哈密顿参数估计方差下界


对于每个配置 ( ρ β init , t τ ) ρ β init  , t τ (rho_(beta)^("init "),t_(tau))\left(\rho_{\beta}^{\text {init }}, t_{\tau}\right) = [ 1 n cfg ] = 1 n cfg  ℓ=[ℓ_(1)dotsℓ_(n_("cfg "))]\ell=\left[\ell_{1} \ldots \ell_{n_{\text {cfg }}}\right] 个实验,假设 θ ^ ( ) R n θ θ ^ ( ) R n θ widehat(theta)(ℓ)inR^(n_(theta))\widehat{\theta}(\ell) \in \mathbf{R}^{n_{\theta}} θ true R n θ θ true  R n θ theta^("true ")inR^(n_(theta))\theta^{\text {true }} \in \mathbf{R}^{n_{\theta}} 的无偏估计。在这些条件下,估计误差方差满足
P θ ^ ( ) θ true 2 V ( , θ true ) = Tr G ( , θ true ) 1 P θ ^ ( ) θ true  2 V , θ true  = Tr G , θ true  1 P||( widehat(theta))(ℓ)-theta^("true ")||^(2) >= V(ℓ,theta^("true "))=Tr G(ℓ,theta^("true "))^(-1)\mathbb{P}\left\|\widehat{\theta}(\ell)-\theta^{\text {true }}\right\|^{2} \geq V\left(\ell, \theta^{\text {true }}\right)=\operatorname{Tr} G\left(\ell, \theta^{\text {true }}\right)^{-1}
 哪里
G ( , θ true ) = β , τ β τ G β τ ( θ true ) R n θ × n θ G β τ ( θ true ) = α [ [ θ p α β τ ( θ ) ] [ θ p α β τ ( θ ) ] T p α β τ ( θ ) θ θ p α β τ ( θ ) ] | θ = θ true R n θ × n θ . G , θ true  = β , τ β τ G β τ θ true  R n θ × n θ G β τ θ true  = α θ p α β τ ( θ ) θ p α β τ ( θ ) T p α β τ ( θ ) θ θ p α β τ ( θ ) θ = θ true  R n θ × n θ . {:[G(ℓ,theta^("true "))=sum_(beta,tau)ℓ_(beta tau)G_(beta tau)(theta^("true "))inR^(n_(theta)xxn_(theta))],[G_(beta tau)(theta^("true "))=sum_(alpha)[([grad_(theta)p_(alpha beta tau)(theta)][grad_(theta)p_(alpha beta tau)(theta)]^(T))/(p_(alpha beta tau)(theta))-grad_(theta theta)p_(alpha beta tau)(theta)]|_(theta=theta^("true "))inR^(n_(theta)xxn_(theta)).]:}\begin{aligned} & G\left(\ell, \theta^{\text {true }}\right)=\sum_{\beta, \tau} \ell_{\beta \tau} G_{\beta \tau}\left(\theta^{\text {true }}\right) \in \mathbf{R}^{n_{\theta} \times n_{\theta}} \\ & G_{\beta \tau}\left(\theta^{\text {true }}\right)=\left.\sum_{\alpha}\left[\frac{\left[\nabla_{\theta} p_{\alpha \beta \tau}(\theta)\right]\left[\nabla_{\theta} p_{\alpha \beta \tau}(\theta)\right]^{T}}{p_{\alpha \beta \tau}(\theta)}-\nabla_{\theta \theta} p_{\alpha \beta \tau}(\theta)\right]\right|_{\theta=\theta^{\text {true }}} \in \mathbf{R}^{n_{\theta} \times n_{\theta}} . \end{aligned}

关于替代 θ ^ θ ^ widehat(theta)\widehat{\theta} 的放松实验设计问题 θ true θ true  theta^("true ")\theta^{\text {true }}
minimize V ( λ , θ ^ ) = Tr [ β , τ λ β τ G β τ θ ^ ) ] 1 subject to β , τ λ β τ = 1 , λ β τ 0 , β , τ  minimize  V ( λ , θ ^ ) = Tr β , τ λ β τ G β τ θ ^ 1  subject to  β , τ λ β τ = 1 , λ β τ 0 , β , τ {:[" minimize ",V(lambda,( widehat(theta)))=Tr[sum_(beta,tau)lambda_(beta tau)G_(beta tau)( widehat(theta)))]^(-1)],[" subject to ",sum_(beta,tau)lambda_(beta tau)=1","quadlambda_(beta tau) >= 0","AA beta","tau]:}\begin{array}{ll} \text { minimize } & \left.V(\lambda, \widehat{\theta})=\operatorname{Tr}\left[\sum_{\beta, \tau} \lambda_{\beta \tau} G_{\beta \tau} \widehat{\theta}\right)\right]^{-1} \\ \text { subject to } & \sum_{\beta, \tau} \lambda_{\beta \tau}=1, \quad \lambda_{\beta \tau} \geq 0, \forall \beta, \tau \end{array}

使用优化变量 λ β τ λ β τ lambda_(beta tau)\lambda_{\beta \tau} ,每个配置的实验分布( ρ β in t , t τ ρ β in  t , t τ rho_(beta)^("in "t),t_(tau)\rho_{\beta}^{\text {in } t}, t_{\tau} )。与之前的公式不同的是,参数没有等式约束。梯度 θ p α β τ ( θ ) θ p α β τ ( θ ) grad_(theta)p_(alpha beta tau)(theta)\nabla_{\theta} p_{\alpha \beta \tau}(\theta) 和雅可比矩阵 θ θ p α β τ ( θ ) θ θ p α β τ ( θ ) grad_(theta theta)p_(alpha beta tau)(theta)\nabla_{\theta \theta} p_{\alpha \beta \tau}(\theta) 依赖于哈密顿量 H ( t , θ ) H ( t , θ ) H(t,theta)H(t, \theta) 的参数结构。

在[87]中深入探讨了一个双参数系统。如那里所述,并在图 31.19 中显示,最优配置和次优配置的最大似然估计在 N N N rarr ooN \rightarrow \infty 时接近费舍尔信息界限(由最优配置提供),而最优配置更快地接近该界限。此外,最大似然估计的均方误差(MSE)对于

图 31.19 最优(方形)和次优(菱形)配置的最大似然估计量的均方误差(MSE)图。还显示了(实线)由最优实验给出的任何估计量的均方误差的费舍尔界限。


为所有 N N NN 优化配置的实验。为了达到相同的均方误差,使用次优配置进行的实验数量大约是使用最优配置所需实验数量的两倍,针对这一特定的猜测和实际参数集。


31.4.3.3 间接自适应控制


哈密顿参数估计可以与基于模型的控制律结合,形成迭代间接自适应控制。作为一个例子,考虑在 [ 88 , 89 ] [ 88 , 89 ] [88,89][88,89] 中提出的自旋相干光子发射/接收系统。该设备通过外部势(门电压)操纵电子自旋,在外部(旋转)磁场的作用下,影响半导体材料中的 g g gg -因子,从而创建量子逻辑门。


根据[90, III, Ch.12-9]关于自旋系统模型的内容,在“线性 g 因子控制”下,二量子比特门的旋转框架中的归一化哈密顿量的理想化模型为
H = H 1 + H 2 + H 12 H 1 = 1 2 [ ε 1 z ω 0 ( Z I 2 ) + ε 1 x ω 1 ( X I 2 ) ] H 2 = 1 2 [ ε 2 z ω 0 ( I 2 Z ) + ε 2 x ω 1 ( I 2 X ) ] H 12 = ε c ω c [ X 2 + Y 2 + Z 2 ] . H = H 1 + H 2 + H 12 H 1 = 1 2 ε 1 z ω 0 Z I 2 + ε 1 x ω 1 X I 2 H 2 = 1 2 ε 2 z ω 0 I 2 Z + ε 2 x ω 1 I 2 X H 12 = ε c ω c X 2 + Y 2 + Z 2 . {:[H=H_(1)+H_(2)+H_(12)],[H_(1)=(1)/(2)[epsi_(1z)omega_(0)(Z oxI_(2))+epsi_(1x)omega_(1)(X oxI_(2))]],[H_(2)=(1)/(2)[epsi_(2z)omega_(0)(I_(2)ox Z)+epsi_(2x)omega_(1)(I_(2)ox X)]],[H_(12)=epsi_(c)omega_(c)[X^(ox2)+Y^(ox2)+Z^(ox2)].]:}\begin{aligned} H & =H_{1}+H_{2}+H_{12} \\ H_{1} & =\frac{1}{2}\left[\varepsilon_{1 z} \omega_{0}\left(Z \otimes I_{2}\right)+\varepsilon_{1 x} \omega_{1}\left(X \otimes I_{2}\right)\right] \\ H_{2} & =\frac{1}{2}\left[\varepsilon_{2 z} \omega_{0}\left(I_{2} \otimes Z\right)+\varepsilon_{2 x} \omega_{1}\left(I_{2} \otimes X\right)\right] \\ H_{12} & =\varepsilon_{c} \omega_{c}\left[X^{\otimes 2}+Y^{\otimes 2}+Z^{\otimes 2}\right] . \end{aligned}

设计目标是使用 5 个控制器( ε 1 z , ε 1 x , ε 2 z , ε 2 x , ε c ε 1 z , ε 1 x , ε 2 z , ε 2 x , ε c epsi_(1z),epsi_(1x),epsi_(2z),epsi_(2x),epsi_(c)\varepsilon_{1 z}, \varepsilon_{1 x}, \varepsilon_{2 z}, \varepsilon_{2 x}, \varepsilon_{c} )来制作贝尔变换逻辑门[45]
U bell = 1 2 [ 1 0 1 0 0 1 0 1 0 1 0 1 1 0 1 0 ] U bell  = 1 2 1 0 1 0 0 1 0 1 0 1 0 1 1 0 1 0 U_("bell ")=(1)/(sqrt2)[[1,0,1,0],[0,1,0,1],[0,1,0,-1],[1,0,-1,0]]U_{\text {bell }}=\frac{1}{\sqrt{2}}\left[\begin{array}{cccc} 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 1 \\ 0 & 1 & 0 & -1 \\ 1 & 0 & -1 & 0 \end{array}\right]

贝尔变换的众多可能分解之一如下:
U bell = ( U had I 2 ) U swap ( X 1 / 2 X 1 / 2 ) U swap ( I 2 X ) . U bell  = U had  I 2 U swap  X 1 / 2 X 1 / 2 U swap  I 2 X . U_("bell ")=(U_("had ")oxI_(2))sqrt(U_("swap "))(X^(-1//2)oxX^(1//2))sqrt(U_("swap "))(I_(2)ox X).U_{\text {bell }}=\left(U_{\text {had }} \otimes I_{2}\right) \sqrt{U_{\text {swap }}}\left(X^{-1 / 2} \otimes X^{1 / 2}\right) \sqrt{U_{\text {swap }}}\left(I_{2} \otimes X\right) .

该序列中的每个操作仅使用单个量子比特和通过同时脉冲 5 个控制器产生的交换“门”,如图 31.20 所示:
ε 1 z ε 1 z epsi_(1z)\varepsilon_{1 z} ε 1 x ε 1 x epsi_(1x)\varepsilon_{1 x} ε 2 z ε 2 z epsi_(2z)\varepsilon_{2 z} ε 2 x ε 2 x epsi_(2x)\varepsilon_{2 x} ε c ε c epsi_(c)\varepsilon_{c} Δ t Δ t Delta t\Delta t  
0 0 0 1 0 π ω 1 π ω 1 (pi)/(omega_(1))\frac{\pi}{\omega_{1}} i I 2 X i I 2 X -iI_(2)ox X-i I_{2} \otimes X
0 0 0 0 1 π 8 ω c π 8 ω c (pi)/(8omega_(c))\frac{\pi}{8 \omega_{c}} e i π 8 U swap e i π 8 U swap  e^(-i(pi)/(8))sqrt(U_("swap "))e^{-i \frac{\pi}{8}} \sqrt{U_{\text {swap }}}
0 0 0 1 0 π 2 ω 1 π 2 ω 1 (pi)/(2omega_(1))\frac{\pi}{2 \omega_{1}} e i π 4 I 2 X 1 / 2 e i π 4 I 2 X 1 / 2 e^(-i(pi)/(4))I_(2)oxX^(1//2)e^{-i \frac{\pi}{4}} I_{2} \otimes X^{1 / 2}
0 1 0 0 0 3 π 2 ω 1 3 π 2 ω 1 (3pi)/(2omega_(1))\frac{3 \pi}{2 \omega_{1}} e i 3 π 4 X 1 / 2 I 2 e i 3 π 4 X 1 / 2 I 2 e^(-i(3pi)/(4))X^(-1//2)oxI_(2)e^{-i \frac{3 \pi}{4}} X^{-1 / 2} \otimes I_{2}
0 0 0 0 1 π 8 ω c π 8 ω c (pi)/(8omega_(c))\frac{\pi}{8 \omega_{c}} e i π 8 U swap e i π 8 U swap  e^(-i(pi)/(8))sqrt(U_("swap "))e^{-i \frac{\pi}{8}} \sqrt{U_{\text {swap }}}
ω had ω 0 2 ω had  ω 0 2 (omega_("had "))/(omega_(0)sqrt2)\frac{\omega_{\text {had }}}{\omega_{0} \sqrt{2}} ω had ω 1 2 ω had  ω 1 2 (omega_("had "))/(omega_(1)sqrt2)\frac{\omega_{\text {had }}}{\omega_{1} \sqrt{2}} 0 0 0 π ω had π ω had  (pi)/(omega_("had "))\frac{\pi}{\omega_{\text {had }}} i U had I 2 i U had  I 2 -iU_("had ")oxI_(2)-i U_{\text {had }} \otimes I_{2}
epsi_(1z) epsi_(1x) epsi_(2z) epsi_(2x) epsi_(c) Delta t gate 0 0 0 1 0 (pi)/(omega_(1)) -iI_(2)ox X 0 0 0 0 1 (pi)/(8omega_(c)) e^(-i(pi)/(8))sqrt(U_("swap ")) 0 0 0 1 0 (pi)/(2omega_(1)) e^(-i(pi)/(4))I_(2)oxX^(1//2) 0 1 0 0 0 (3pi)/(2omega_(1)) e^(-i(3pi)/(4))X^(-1//2)oxI_(2) 0 0 0 0 1 (pi)/(8omega_(c)) e^(-i(pi)/(8))sqrt(U_("swap ")) (omega_("had "))/(omega_(0)sqrt2) (omega_("had "))/(omega_(1)sqrt2) 0 0 0 (pi)/(omega_("had ")) -iU_("had ")oxI_(2)| $\varepsilon_{1 z}$ | $\varepsilon_{1 x}$ | $\varepsilon_{2 z}$ | $\varepsilon_{2 x}$ | $\varepsilon_{c}$ | $\Delta t$ | gate | | :---: | :---: | :---: | :---: | :---: | :---: | :---: | | 0 | 0 | 0 | 1 | 0 | $\frac{\pi}{\omega_{1}}$ | $-i I_{2} \otimes X$ | | 0 | 0 | 0 | 0 | 1 | $\frac{\pi}{8 \omega_{c}}$ | $e^{-i \frac{\pi}{8}} \sqrt{U_{\text {swap }}}$ | | 0 | 0 | 0 | 1 | 0 | $\frac{\pi}{2 \omega_{1}}$ | $e^{-i \frac{\pi}{4}} I_{2} \otimes X^{1 / 2}$ | | 0 | 1 | 0 | 0 | 0 | $\frac{3 \pi}{2 \omega_{1}}$ | $e^{-i \frac{3 \pi}{4}} X^{-1 / 2} \otimes I_{2}$ | | 0 | 0 | 0 | 0 | 1 | $\frac{\pi}{8 \omega_{c}}$ | $e^{-i \frac{\pi}{8}} \sqrt{U_{\text {swap }}}$ | | $\frac{\omega_{\text {had }}}{\omega_{0} \sqrt{2}}$ | $\frac{\omega_{\text {had }}}{\omega_{1} \sqrt{2}}$ | 0 | 0 | 0 | $\frac{\pi}{\omega_{\text {had }}}$ | $-i U_{\text {had }} \otimes I_{2}$ |

图 31.20 脉冲控制表。

最终时刻的结果门 t f t f t_(f)t_{\mathrm{f}} 在标量相位内是 U bell U bell  U_("bell ")U_{\text {bell }}
U ( t f ) = e i π 4 U bell , t f = [ 3 ω 1 + 1 4 ω c + 1 ω had ] π U t f = e i π 4 U bell , t f = 3 ω 1 + 1 4 ω c + 1 ω had π U(t_(f))=e^(-i(pi)/(4))U_(bell),quadt_(f)=[(3)/(omega_(1))+(1)/(4omega_(c))+(1)/(omega_(had))]piU\left(t_{\mathrm{f}}\right)=e^{-i \frac{\pi}{4}} U_{\mathrm{bell}}, \quad t_{\mathrm{f}}=\left[\frac{3}{\omega_{1}}+\frac{1}{4 \omega_{c}}+\frac{1}{\omega_{\mathrm{had}}}\right] \pi

假设唯一未知的参数是 ω 1 ω 1 omega_(1)\omega_{1} 。考虑以下估计与控制之间的基本迭代:
 控制设计 ε ( i ) = ε ¯ ( ω ^ 1 ( i ) ) , t f ( i ) = t f ( ω ^ 1 ( i ) ) ε ( i ) = ε ¯ ω ^ 1 ( i ) , t f ( i ) = t f ω ^ 1 ( i ) epsi^((i))= bar(epsi)( widehat(omega)_(1)^((i))),quadt_(f)^((i))=t_(f)( widehat(omega)_(1)^((i)))\varepsilon^{(i)}=\bar{\varepsilon}\left(\widehat{\omega}_{1}^{(i)}\right), \quad t_{\mathrm{f}}^{(i)}=t_{\mathrm{f}}\left(\widehat{\omega}_{1}^{(i)}\right)
 估算 ω ^ 1 ( i + 1 ) = arg min ω 1 P L ( ω 1 , ε ( i ) ) ω ^ 1 ( i + 1 ) = arg min ω 1 P L ω 1 , ε ( i ) widehat(omega)_(1)^((i+1))=arg min_(omega_(1))PL(omega_(1),epsi^((i)))\widehat{\omega}_{1}^{(i+1)}=\arg \min _{\omega_{1}} \mathbb{P} L\left(\omega_{1}, \varepsilon^{(i)}\right)