Dyskryminacja i tomografia stanów kwantowych

W ostatniej części lekcji krótko omówimy dwa zadania związane z pomiarami: dyskryminację stanów kwantowych i tomografię stanów kwantowych.

Dyskryminacja stanów kwantowych

W dyskryminacji stanów kwantowych dysponujemy znanym zbiorem stanów kwantowych $\rho_0,\ldots,\rho_{m-1},$ wraz z prawdopodobieństwami $p_0,\ldots,p_{m-1}$ przypisanymi do tych stanów. Zwięzłym sposobem wyrażenia tego jest stwierdzenie, że mamy ensemble
$\{(p_0,\rho_0),\ldots,(p_{m-1},\rho_{m-1})\}$
stanów kwantowych.

Liczba $a\in\{0,\ldots,m-1\}$ jest wybierana losowo zgodnie z prawdopodobieństwami $(p_0,\ldots,p_{m-1})$ , a układ $\mathsf{X}$ jest przygotowywany w stanie $\rho_a.$ Celem jest ustalenie, za pomocą pomiaru samego $\mathsf{X}$ , która wartość $a$ została wybrana.

Mamy więc skończoną liczbę alternatyw wraz z prior — czyli naszą wiedzą o prawdopodobieństwie wyboru każdego $a$ — a celem jest ustalenie, która alternatywa faktycznie zaszła. Dla jednych wyborów stanów i prawdopodobieństw może to być łatwe, dla innych może nie być możliwe bez pewnego ryzyka popełnienia błędu.
Tomografia stanów kwantowych

W tomografii stanów kwantowych mamy do czynienia z nieznanym stanem kwantowym układu — więc w odróżnieniu od dyskryminacji stanów kwantowych zazwyczaj nie ma prior ani żadnych informacji o możliwych alternatywach.

Tym razem jednak nie jest dostępna pojedyncza kopia stanu, lecz wiele niezależnych kopii. To znaczy, $N$ identycznych układów $\mathsf{X}_1,\ldots,\mathsf{X}_N$ jest każdy niezależnie przygotowywany w stanie $\rho$ dla pewnej (możliwie dużej) liczby $N.$ Celem jest znalezienie przybliżenia nieznanego stanu, jako macierz gęstości, poprzez pomiar tych układów.

Rozróżnianie dwóch stanów

Najprostszym przypadkiem dyskryminacji stanów kwantowych jest sytuacja, w której rozróżniamy dwa stany, $\rho_0$ i $\rho_1.$

Wyobraź sobie sytuację, w której bit $a$ jest wybierany losowo: $a = 0$ z prawdopodobieństwem $p$ i $a = 1$ z prawdopodobieństwem $1 - p.$ Układ $\mathsf{X}$ jest przygotowywany w stanie $\rho_a,$ czyli $\rho_0$ lub $\rho_1$ w zależności od wartości $a,$ i przekazywany nam. Naszym celem jest poprawne odgadnięcie wartości $a$ za pomocą pomiaru na $\mathsf{X}.$ Dokładniej, będziemy dążyć do zmaksymalizowania prawdopodobieństwa, że nasze przypuszczenie jest poprawne.

Optymalny pomiar

Optymalny sposób rozwiązania tego problemu zaczyna się od rozkładu spektralnego ważonej różnicy między $\rho_0$ i $\rho_1,$ gdzie wagi to odpowiednie prawdopodobieństwa.

p \rho_0 - (1-p) \rho_1 = \sum_{k = 0}^{n-1} \lambda_k \vert \psi_k \rangle \langle \psi_k \vert

Zauważ, że mamy znak minus zamiast znaku plus w tym wyrażeniu: jest to ważona różnica, a nie ważona suma.

Możemy zmaksymalizować prawdopodobieństwo poprawnego odgadnięcia, wybierając pomiar rzutowy $\{\Pi_0,\Pi_1\}$ w następujący sposób. Najpierw podzielmy elementy zbioru $\{0,\ldots,n-1\}$ na dwa rozłączne zbiory $S_0$ i $S_1$ w zależności od tego, czy odpowiadająca wartość własna ważonej różnicy jest nieujemna, czy ujemna.

\begin{gathered} S_0 = \{k\in\{0,\ldots,n-1\} : \lambda_k \geq 0 \}\\[2mm] S_1 = \{k\in\{0,\ldots,n-1\} : \lambda_k < 0 \} \end{gathered}

Możemy wówczas wybrać pomiar rzutowy w następujący sposób.

\Pi_0 = \sum_{k \in S_0} \vert \psi_k \rangle \langle \psi_k \vert \quad\text{and}\quad \Pi_1 = \sum_{k \in S_1} \vert \psi_k \rangle \langle \psi_k \vert

(W rzeczywistości nie ma znaczenia, do którego ze zbiorów $S_0$ lub $S_1$ włączymy wartości $k,$ dla których $\lambda_k = 0.$ Tutaj arbitralnie włączamy te wartości do $S_0.$ )

Jest to optymalny pomiar w tej sytuacji, minimalizujący prawdopodobieństwo błędnego określenia wybranego stanu.

Prawdopodobieństwo poprawności

Teraz wyznaczymy prawdopodobieństwo poprawności dla pomiaru $\{\Pi_0,\Pi_1\}.$

Na początek nie musimy się zbytnio skupiać na konkretnym wyborze $\Pi_0$ i $\Pi_1,$ choć warto o nim pamiętać. Dla dowolnego pomiaru $\{P_0,P_1\}$ (niekoniecznie rzutowego) możemy zapisać prawdopodobieństwo poprawności następująco.

p \operatorname{Tr}(P_0 \rho_0) + (1 - p) \operatorname{Tr}(P_1 \rho_1)

Korzystając z faktu, że $\{P_0,P_1\}$ jest pomiarem, więc $P_1 = \mathbb{I} - P_0,$ możemy przepisać to wyrażenie w następujący sposób.

p \operatorname{Tr}(P_0 \rho_0) + (1 - p) \operatorname{Tr}((\mathbb{I} - P_0) \rho_1)\hspace*{3cm}\\[1mm] \begin{aligned} & = p \operatorname{Tr}(P_0 \rho_0) - (1 - p) \operatorname{Tr}(P_0 \rho_1) + (1-p) \operatorname{Tr}(\rho_1)\\[1mm] & = \operatorname{Tr}\bigl( P_0 (p \rho_0 - (1-p)\rho_1) \bigr) + 1 - p \end{aligned}

Z drugiej strony mogliśmy podstawić $P_0 = \mathbb{I} - P_1.$ Nie zmienia to wartości, ale daje nam alternatywne wyrażenie.

p \operatorname{Tr}((\mathbb{I} - P_1) \rho_0) + (1 - p) \operatorname{Tr}(P_1 \rho_1)\hspace*{3cm}\\[1mm] \begin{aligned} & = p \operatorname{Tr}(\rho_0) - p \operatorname{Tr}(P_1 \rho_0) + (1 - p) \operatorname{Tr}(P_1 \rho_1)\\[1mm] & = p - \operatorname{Tr}\bigl( P_1 (p \rho_0 - (1-p)\rho_1) \bigr) \end{aligned}

Oba wyrażenia mają tę samą wartość, więc możemy je uśrednić, uzyskując jeszcze inne wyrażenie dla tej wartości. (Uśrednianie obu wyrażeń to jedynie trick mający uprościć wynikowe wyrażenie.)

\frac{1}{2} \bigl(\operatorname{Tr}\bigl( P_0 (p \rho_0 - (1-p)\rho_1) \bigr) + 1-p\bigr) + \frac{1}{2} \bigl(p - \operatorname{Tr}\bigl( P_1 (p \rho_0 - (1-p)\rho_1) \bigr)\bigr)\\ = \frac{1}{2} \operatorname{Tr}\bigl( (P_0-P_1) (p \rho_0 - (1-p)\rho_1)\bigr) + \frac{1}{2}

Teraz widać, dlaczego sensowne jest wybranie projekcji $\Pi_0$ i $\Pi_1$ (jak określono powyżej) dla $P_0$ i $P_1$ — bo właśnie tak możemy zmaksymalizować ślad w końcowym wyrażeniu. W szczególności

(\Pi_0-\Pi_1) (p \rho_0 - (1-p)\rho_1) = \sum_{k = 0}^{n-1} \vert\lambda_k\vert \cdot \vert \psi_k \rangle \langle \psi_k \vert.

Gdy zatem obliczymy ślad, otrzymujemy sumę wartości bezwzględnych wartości własnych — co równa się temu, co znane jest jako trace norm ważonej różnicy.

\operatorname{Tr}\bigl( (\Pi_0-\Pi_1) (p \rho_0 - (1-p)\rho_1)\bigr) = \sum_{k = 0}^{n-1} \vert\lambda_k\vert = \bigl\| p \rho_0 - (1-p)\rho_1 \bigr\|_1

Zatem prawdopodobieństwo, że pomiar $\{\Pi_0,\Pi_1\}$ prowadzi do poprawnej dyskryminacji $\rho_0$ i $\rho_1,$ dane z prawdopodobieństwami $p$ i $1-p$ odpowiednio, wynosi:

\frac{1}{2} + \frac{1}{2} \bigl\| p \rho_0 - (1-p)\rho_1 \bigr\|_1

Fakt, że jest to optymalne prawdopodobieństwo poprawnej dyskryminacji $\rho_0$ i $\rho_1,$ dane z prawdopodobieństwami $p$ i $1-p,$ jest powszechnie określany jako twierdzenie Helstroma–Holevo (lub czasem po prostu twierdzenie Helstroma).

Dyskryminacja trzech lub więcej stanów

W przypadku dyskryminacji stanów kwantowych, gdy mamy do czynienia z trzema lub większą liczbą stanów, nie jest znane żadne zamknięte wyrażenie analityczne na optymalny pomiar, choć możliwe jest sformułowanie tego problemu jako program semidefinitowy — co pozwala na efektywne numeryczne aproksymacje optymalnych pomiarów przy pomocy komputera.

Możliwe jest również weryfikowanie (lub falsyfikowanie) optymalności danego pomiaru w zadaniu dyskryminacji stanów za pomocą warunku zwanego warunkiem Holevo-Yuen-Kennedy-Lax. W szczególności, dla zadania dyskryminacji stanów zdefiniowanego przez ensemble

\{(p_0,\rho_0),\ldots,(p_{m-1},\rho_{m-1})\},

pomiar $\{P_0,\ldots,P_{m-1}\}$ jest optymalny wtedy i tylko wtedy, gdy macierz

Q_a = \sum_{b = 0}^{m-1} p_b \rho_b P_b - p_a \rho_a

jest dodatnio półokreślona dla każdego $a\in\{0,\ldots,m-1\}.$

Rozważmy na przykład zadanie dyskryminacji stanów kwantowych, w którym jeden z czterech stanów czworościennych $\vert\phi_0\rangle,\ldots,\vert\phi_3\rangle$ jest wybierany jednostajnie losowo. Pomiar czworościenny $\{P_0,P_1,P_2,P_3\}$ odnosi sukces z prawdopodobieństwem

\frac{1}{4} \operatorname{Tr}(P_0 \vert\phi_0\rangle\langle \phi_0 \vert) + \frac{1}{4} \operatorname{Tr}(P_1 \vert\phi_1\rangle\langle \phi_1 \vert) + \frac{1}{4} \operatorname{Tr}(P_2 \vert\phi_2\rangle\langle \phi_2 \vert) + \frac{1}{4} \operatorname{Tr}(P_3 \vert\phi_3\rangle\langle \phi_3 \vert) = \frac{1}{2}.

Jest to optymalne na mocy warunku Holevo-Yuen-Kennedy-Lax, co można sprawdzić obliczając, że

Q_a = \frac{1}{4}(\mathbb{I} - \vert\phi_a\rangle\langle\phi_a\vert) \geq 0

dla $a = 0,1,2,3.$

Kwantowa tomografia stanów

Na koniec omówimy pokrótce problem kwantowej tomografii stanów. W tym problemie dysponujesz dużą liczbą $N$ niezależnych kopii nieznanego stanu kwantowego $\rho,$ a celem jest zrekonstruowanie aproksymacji $\tilde{\rho}$ stanu $\rho.$ Mówiąc wprost, chodzi o znalezienie klasycznego opisu macierz gęstości $\tilde{\rho}$ możliwie jak najbliższej $\rho.$

Możemy też opisać tę sytuację w następujący sposób. Wybierana jest nieznana macierz gęstości $\rho,$ a my mamy dostęp do $N$ układów kwantowych $\mathsf{X}_1,\ldots,\mathsf{X}_N,$ z których każdy został niezależnie przygotowany w stanie $\rho.$ A zatem stan złożonego układu $(\mathsf{X}_1,\ldots,\mathsf{X}_N)$ wynosi

\rho^{\otimes N} = \rho \otimes \rho \otimes \cdots \otimes \rho \quad \text{($N$ razy)}

Celem jest wykonanie pomiarów na układach $\mathsf{X}_1,\ldots,\mathsf{X}_N$ i — na podstawie wyników tych pomiarów — obliczenie macierz gęstości $\tilde{\rho}$ blisko aproksymującej $\rho.$ Okazuje się, że jest to fascynujący problem i wciąż jest on przedmiotem aktywnych badań.

Można rozważać różne typy strategii podejścia do tego problemu. Na przykład możemy wyobrazić sobie strategię, w której każdy z układów $\mathsf{X}_1,\ldots,\mathsf{X}_N$ jest mierzony osobno, kolejno, dając ciąg wyników pomiarów. Możliwe są różne konkretne wybory dotyczące tego, jakie pomiary są wykonywane, w tym wybory adaptacyjne i nieadaptacyjne. Innymi słowy, wybór pomiaru wykonywanego na danym układzie może, lecz nie musi zależeć od wyników wcześniejszych pomiarów. Na podstawie ciągu wyników pomiarów wyznaczana jest zgadywana wartość $\tilde{\rho}$ stanu $\rho$ — i tu również istnieją różne metodologie.

Alternatywnym podejściem jest wykonanie pojedynczego pomiaru łącznego na całej kolekcji, gdzie traktujemy $(\mathsf{X}_1,\ldots,\mathsf{X}_N)$ jako jeden układ i wybieramy jeden pomiar, którego wynik stanowi aproksymację $\tilde{\rho}$ stanu $\rho.$ Może to prowadzić do lepszego oszacowania niż to, co jest możliwe przy osobnych pomiarach poszczególnych układów, choć łączny pomiar na wszystkich układach jednocześnie jest zapewne znacznie trudniejszy do zrealizowania w praktyce.

Tomografia qubitów przy użyciu pomiarów Pauli

Rozważymy teraz kwantową tomografię stanów w prostym przypadku, gdy $\rho$ jest qubitową macierz gęstości. Zakładamy, że mamy dane kubity $\mathsf{X}_1,\ldots,\mathsf{X}_N,$ z których każdy jest niezależnie w stanie $\rho,$ a naszym celem jest obliczenie aproksymacji $\tilde{\rho}$ bliskiej $\rho.$

Nasza strategia polega na podzieleniu $N$ qubitów $\mathsf{X}_1,\ldots,\mathsf{X}_N$ na trzy mniej więcej równoliczne kolekcje, po jednej na każdą z trzech macierzy Pauli $\sigma_x,$ $\sigma_y,$ oraz $\sigma_z.$ Każdy qubit jest następnie mierzony niezależnie w sposób opisany poniżej.

Dla każdego z qubitów z kolekcji powiązanej z $\sigma_x$ wykonujemy pomiar $\sigma_x$ . Oznacza to, że qubit jest mierzony względem bazy $\{\vert + \rangle, \vert -\rangle\},$ która jest ortonormalną bazą wektorów własnych $\sigma_x,$ a odpowiadające wyniki pomiarów to wartości własne przypisane obu wektorom własnym: $+1$ dla stanu $\vert + \rangle$ i $-1$ dla stanu $\vert -\rangle.$ Uśredniając wyniki po wszystkich stanach z kolekcji powiązanej z $\sigma_x,$ otrzymujemy aproksymację wartości oczekiwanej
$\langle + \vert \rho \vert + \rangle - \langle - \vert \rho \vert - \rangle = \operatorname{Tr}(\sigma_x \rho).$
Dla każdego z qubitów z kolekcji powiązanej z $\sigma_y$ wykonujemy pomiar $\sigma_y$ . Taki pomiar jest podobny do pomiaru $\sigma_x,$ z tym że bazą pomiarową jest $\{\vert\! +\!i \rangle, \vert\! -\!i \rangle\},$ czyli wektory własne $\sigma_y.$ Uśredniając wyniki po wszystkich stanach z kolekcji powiązanej z $\sigma_y,$ otrzymujemy aproksymację wartości oczekiwanej
$\langle +i \vert \rho \vert \!+\!i \rangle - \langle -i \vert \rho \vert \!-\!i \rangle = \operatorname{Tr}(\sigma_y \rho).$
Dla każdego z qubitów z kolekcji powiązanej z $\sigma_z$ wykonujemy pomiar $\sigma_z$ . Tym razem bazą pomiarową jest baza standardowa $\{\vert 0\rangle, \vert 1 \rangle\},$ czyli wektory własne $\sigma_z.$ Uśredniając wyniki po wszystkich stanach z kolekcji powiązanej z $\sigma_z,$ otrzymujemy aproksymację wartości oczekiwanej
$\langle 0 \vert \rho \vert 0 \rangle - \langle 1 \vert \rho \vert 1 \rangle = \operatorname{Tr}(\sigma_z \rho).$

Po uzyskaniu aproksymacji

\alpha_x \approx \operatorname{Tr}(\sigma_x \rho),\; \alpha_y \approx \operatorname{Tr}(\sigma_y \rho),\; \alpha_z \approx \operatorname{Tr}(\sigma_z \rho)

przez uśrednienie wyników pomiarów dla każdej kolekcji, możemy aproksymować $\rho$ jako

\tilde{\rho} = \frac{\mathbb{I} + \alpha_x \sigma_x + \alpha_y \sigma_y + \alpha_z \sigma_z}{2} \approx \frac{\mathbb{I} + \operatorname{Tr}(\sigma_x \rho) \sigma_x + \operatorname{Tr}(\sigma_y \rho) \sigma_y + \operatorname{Tr}(\sigma_z \rho) \sigma_z}{2} = \rho.

W granicy, gdy $N$ dąży do nieskończoności, ta aproksymacja zbiega według prawdopodobieństwa do prawdziwej macierz gęstości $\rho$ na mocy prawa wielkich liczb, a dobrze znane ograniczenia statystyczne (takie jak nierówność Hoeffdinga) mogą być używane do ograniczania prawdopodobieństwa, że aproksymacja $\tilde{\rho}$ odchyla się od $\rho$ o zadaną wielkość.

Ważną rzeczą do dostrzeżenia jest jednak to, że macierz $\tilde{\rho}$ uzyskana w ten sposób może nie być macierz gęstości. W szczególności, choć zawsze będzie miała ślad równy $1,$ może nie być dodatnio półokreślona. Istnieją różne znane strategie „zaokrąglania" takiej aproksymacji $\tilde{\rho}$ do macierz gęstości — jedna z nich polega na obliczeniu rozkładu spektralnego, zastąpieniu ujemnych wartości własnych zerami, a następnie renormalizacji (przez podzielenie otrzymanej macierzy przez jej ślad).

Tomografia qubitów przy użyciu pomiaru tetraedrycznego

Inną opcją przeprowadzania tomografii qubitów jest pomiar każdego kubitu $\mathsf{X}_1,\ldots,\mathsf{X}_N$ za pomocą pomiaru tetraedrycznego $\{P_0,P_1,P_2,P_3\}$ opisanego wcześniej. Czyli,

P_0 = \frac{\vert \phi_0 \rangle \langle \phi_0 \vert}{2}, \quad P_1 = \frac{\vert \phi_1 \rangle \langle \phi_1 \vert}{2}, \quad P_2 = \frac{\vert \phi_2 \rangle \langle \phi_2 \vert}{2}, \quad P_3 = \frac{\vert \phi_3 \rangle \langle \phi_3 \vert}{2}

dla

\begin{aligned} \vert \phi_0 \rangle & = \vert 0 \rangle\\ \vert \phi_1 \rangle & = \frac{1}{\sqrt{3}} \vert 0 \rangle + \sqrt{\frac{2}{3}} \vert 1 \rangle\\ \vert \phi_2 \rangle & = \frac{1}{\sqrt{3}} \vert 0 \rangle + \sqrt{\frac{2}{3}} e^{2\pi i/3} \vert 1 \rangle\\ \vert \phi_3 \rangle & = \frac{1}{\sqrt{3}} \vert 0 \rangle + \sqrt{\frac{2}{3}} e^{-2\pi i/3} \vert 1 \rangle. \end{aligned}

Każdy wynik jest uzyskiwany pewną liczbę razy, którą będziemy oznaczać jako $n_a$ dla każdego $a\in\{0,1,2,3\},$ tak że $n_0 + n_1 + n_2 + n_3 = N.$ Stosunek tych liczb do $N$ daje przybliżenie prawdopodobieństwa związanego z każdym możliwym wynikiem:

\frac{n_a}{N} \approx \operatorname{Tr}(P_a \rho).

Na koniec skorzystamy z następującego niezwykłego wzoru:

\rho = \sum_{a=0}^3 \Bigl( 3 \operatorname{Tr}(P_a \rho) - \frac{1}{2}\Bigr) \vert \phi_a \rangle \langle \phi_a \vert.

Aby uzasadnić ten wzór, możemy skorzystać z poniższego równania dla kwadratów wartości bezwzględnych iloczynów skalarnych stanów tetraedrycznych, które można zweryfikować przez bezpośrednie obliczenia.

\bigl\vert \langle \phi_a \vert \phi_b \rangle \bigr\vert^2 = \begin{cases} 1 & a=b\\ \frac{1}{3} & a\neq b. \end{cases}

Cztery macierze

\begin{aligned} \vert\phi_0\rangle \langle \phi_0 \vert & = \begin{pmatrix} 1 & 0\\[2mm] 0 & 0\end{pmatrix}\\[3mm] \vert\phi_1\rangle \langle \phi_1 \vert & = \begin{pmatrix} \frac{1}{3} & \frac{\sqrt{2}}{3}\\[2mm] \frac{\sqrt{2}}{3} & \frac{2}{3}\end{pmatrix}\\[3mm] \vert\phi_2\rangle \langle \phi_2 \vert & = \begin{pmatrix} \frac{1}{3} & \frac{\sqrt{2}}{3}e^{-2\pi i/3}\\[2mm] \frac{\sqrt{2}}{3}e^{2\pi i/3} & \frac{2}{3}\end{pmatrix}\\[3mm] \vert\phi_3\rangle \langle \phi_3 \vert & = \begin{pmatrix} \frac{1}{3} & \frac{\sqrt{2}}{3}e^{2\pi i/3}\\[2mm] \frac{\sqrt{2}}{3}e^{-2\pi i/3} & \frac{2}{3}\end{pmatrix} \end{aligned}

są liniowo niezależne, więc wystarczy udowodnić, że wzór jest prawdziwy dla $\rho = \vert\phi_b\rangle\langle\phi_b\vert$ dla $b = 0,1,2,3.$ W szczególności,

3 \operatorname{Tr}(P_a \vert\phi_b\rangle\langle\phi_b\vert) - \frac{1}{2} = \frac{3}{2} \vert \langle \phi_a \vert \phi_b \rangle \vert^2 - \frac{1}{2} = \begin{cases} 1 & a=b\\ 0 & a\neq b \end{cases}

i w związku z tym

\sum_{a=0}^3 \biggl( 3 \operatorname{Tr}(P_a \vert\phi_b\rangle\langle\phi_b\vert) - \frac{\operatorname{Tr}(\vert\phi_b\rangle\langle\phi_b\vert)}{2}\biggr) \vert \phi_a \rangle \langle \phi_a \vert = \vert \phi_b\rangle\langle \phi_b \vert.

Otrzymujemy przybliżenie $\rho:$

\tilde{\rho} = \sum_{a=0}^3 \Bigl( \frac{3 n_a}{N} - \frac{1}{2}\Bigr) \vert \phi_a \rangle \langle \phi_a \vert.

To przybliżenie zawsze będzie macierzą hermitowską o śladzie równym jeden, jednak może nie być dodatnio półokreślone. W takim przypadku przybliżenie to musi zostać „zaokrąglone" do macierzy gęstości, podobnie jak w strategii stosowanej przy pomiarach Pauliego.

Rozróżnianie dwóch stanów​

Optymalny pomiar​

Prawdopodobieństwo poprawności​

Dyskryminacja trzech lub więcej stanów​

Kwantowa tomografia stanów​

Tomografia qubitów przy użyciu pomiarów Pauli​

Tomografia qubitów przy użyciu pomiaru tetraedrycznego​