Przejdź do głównej treści

Dyskryminacja i tomografia stanów kwantowych

W ostatniej części lekcji krótko omówimy dwa zadania związane z pomiarami: dyskryminację stanów kwantowych i tomografię stanów kwantowych.

  1. Dyskryminacja stanów kwantowych

    W dyskryminacji stanów kwantowych dysponujemy znanym zbiorem stanów kwantowych ρ0,,ρm1,\rho_0,\ldots,\rho_{m-1}, wraz z prawdopodobieństwami p0,,pm1p_0,\ldots,p_{m-1} przypisanymi do tych stanów. Zwięzłym sposobem wyrażenia tego jest stwierdzenie, że mamy ensemble

    {(p0,ρ0),,(pm1,ρm1)}\{(p_0,\rho_0),\ldots,(p_{m-1},\rho_{m-1})\}

    stanów kwantowych.

    Liczba a{0,,m1}a\in\{0,\ldots,m-1\} jest wybierana losowo zgodnie z prawdopodobieństwami (p0,,pm1)(p_0,\ldots,p_{m-1}), a układ X\mathsf{X} jest przygotowywany w stanie ρa.\rho_a. Celem jest ustalenie, za pomocą pomiaru samego X\mathsf{X}, która wartość aa została wybrana.

    Mamy więc skończoną liczbę alternatyw wraz z prior — czyli naszą wiedzą o prawdopodobieństwie wyboru każdego aa — a celem jest ustalenie, która alternatywa faktycznie zaszła. Dla jednych wyborów stanów i prawdopodobieństw może to być łatwe, dla innych może nie być możliwe bez pewnego ryzyka popełnienia błędu.

  2. Tomografia stanów kwantowych

    W tomografii stanów kwantowych mamy do czynienia z nieznanym stanem kwantowym układu — więc w odróżnieniu od dyskryminacji stanów kwantowych zazwyczaj nie ma prior ani żadnych informacji o możliwych alternatywach.

    Tym razem jednak nie jest dostępna pojedyncza kopia stanu, lecz wiele niezależnych kopii. To znaczy, NN identycznych układów X1,,XN\mathsf{X}_1,\ldots,\mathsf{X}_N jest każdy niezależnie przygotowywany w stanie ρ\rho dla pewnej (możliwie dużej) liczby N.N. Celem jest znalezienie przybliżenia nieznanego stanu, jako density matrix, poprzez pomiar tych układów.

Discriminating between two states

Najprostszym przypadkiem dyskryminacji stanów kwantowych jest sytuacja, w której rozróżniamy dwa stany, ρ0\rho_0 i ρ1.\rho_1.

Wyobraź sobie sytuację, w której bit aa jest wybierany losowo: a=0a = 0 z prawdopodobieństwem pp i a=1a = 1 z prawdopodobieństwem 1p.1 - p. Układ X\mathsf{X} jest przygotowywany w stanie ρa,\rho_a, czyli ρ0\rho_0 lub ρ1\rho_1 w zależności od wartości a,a, i przekazywany nam. Naszym celem jest poprawne odgadnięcie wartości aa za pomocą pomiaru na X.\mathsf{X}. Dokładniej, będziemy dążyć do zmaksymalizowania prawdopodobieństwa, że nasze przypuszczenie jest poprawne.

An optimal measurement

Optymalny sposób rozwiązania tego problemu zaczyna się od rozkładu spektralnego ważonej różnicy między ρ0\rho_0 i ρ1,\rho_1, gdzie wagi to odpowiednie prawdopodobieństwa.

pρ0(1p)ρ1=k=0n1λkψkψkp \rho_0 - (1-p) \rho_1 = \sum_{k = 0}^{n-1} \lambda_k \vert \psi_k \rangle \langle \psi_k \vert

Zauważ, że mamy znak minus zamiast znaku plus w tym wyrażeniu: jest to ważona różnica, a nie ważona suma.

Możemy zmaksymalizować prawdopodobieństwo poprawnego odgadnięcia, wybierając projective measurement {Π0,Π1}\{\Pi_0,\Pi_1\} w następujący sposób. Najpierw podzielmy elementy zbioru {0,,n1}\{0,\ldots,n-1\} na dwa rozłączne zbiory S0S_0 i S1S_1 w zależności od tego, czy odpowiadająca wartość własna ważonej różnicy jest nieujemna, czy ujemna.

S0={k{0,,n1}:λk0}S1={k{0,,n1}:λk<0}\begin{gathered} S_0 = \{k\in\{0,\ldots,n-1\} : \lambda_k \geq 0 \}\\[2mm] S_1 = \{k\in\{0,\ldots,n-1\} : \lambda_k < 0 \} \end{gathered}

Możemy wówczas wybrać projective measurement w następujący sposób.

Π0=kS0ψkψkandΠ1=kS1ψkψk\Pi_0 = \sum_{k \in S_0} \vert \psi_k \rangle \langle \psi_k \vert \quad\text{and}\quad \Pi_1 = \sum_{k \in S_1} \vert \psi_k \rangle \langle \psi_k \vert

(W rzeczywistości nie ma znaczenia, do którego ze zbiorów S0S_0 lub S1S_1 włączymy wartości k,k, dla których λk=0.\lambda_k = 0. Tutaj arbitralnie włączamy te wartości do S0.S_0.)

Jest to optymalny pomiar w tej sytuacji, minimalizujący prawdopodobieństwo błędnego określenia wybranego stanu.

Correctness probability

Teraz wyznaczymy prawdopodobieństwo poprawności dla pomiaru {Π0,Π1}.\{\Pi_0,\Pi_1\}.

Na początek nie musimy się zbytnio skupiać na konkretnym wyborze Π0\Pi_0 i Π1,\Pi_1, choć warto o nim pamiętać. Dla dowolnego pomiaru {P0,P1}\{P_0,P_1\} (niekoniecznie projective) możemy zapisać prawdopodobieństwo poprawności następująco.

pTr(P0ρ0)+(1p)Tr(P1ρ1)p \operatorname{Tr}(P_0 \rho_0) + (1 - p) \operatorname{Tr}(P_1 \rho_1)

Korzystając z faktu, że {P0,P1}\{P_0,P_1\} jest pomiarem, więc P1=IP0,P_1 = \mathbb{I} - P_0, możemy przepisać to wyrażenie w następujący sposób.

pTr(P0ρ0)+(1p)Tr((IP0)ρ1)=pTr(P0ρ0)(1p)Tr(P0ρ1)+(1p)Tr(ρ1)=Tr(P0(pρ0(1p)ρ1))+1pp \operatorname{Tr}(P_0 \rho_0) + (1 - p) \operatorname{Tr}((\mathbb{I} - P_0) \rho_1)\hspace*{3cm}\\[1mm] \begin{aligned} & = p \operatorname{Tr}(P_0 \rho_0) - (1 - p) \operatorname{Tr}(P_0 \rho_1) + (1-p) \operatorname{Tr}(\rho_1)\\[1mm] & = \operatorname{Tr}\bigl( P_0 (p \rho_0 - (1-p)\rho_1) \bigr) + 1 - p \end{aligned}

Z drugiej strony mogliśmy podstawić P0=IP1.P_0 = \mathbb{I} - P_1. Nie zmienia to wartości, ale daje nam alternatywne wyrażenie.

pTr((IP1)ρ0)+(1p)Tr(P1ρ1)=pTr(ρ0)pTr(P1ρ0)+(1p)Tr(P1ρ1)=pTr(P1(pρ0(1p)ρ1))p \operatorname{Tr}((\mathbb{I} - P_1) \rho_0) + (1 - p) \operatorname{Tr}(P_1 \rho_1)\hspace*{3cm}\\[1mm] \begin{aligned} & = p \operatorname{Tr}(\rho_0) - p \operatorname{Tr}(P_1 \rho_0) + (1 - p) \operatorname{Tr}(P_1 \rho_1)\\[1mm] & = p - \operatorname{Tr}\bigl( P_1 (p \rho_0 - (1-p)\rho_1) \bigr) \end{aligned}

Oba wyrażenia mają tę samą wartość, więc możemy je uśrednić, uzyskując jeszcze inne wyrażenie dla tej wartości. (Uśrednianie obu wyrażeń to jedynie trick mający uprościć wynikowe wyrażenie.)

12(Tr(P0(pρ0(1p)ρ1))+1p)+12(pTr(P1(pρ0(1p)ρ1)))=12Tr((P0P1)(pρ0(1p)ρ1))+12\frac{1}{2} \bigl(\operatorname{Tr}\bigl( P_0 (p \rho_0 - (1-p)\rho_1) \bigr) + 1-p\bigr) + \frac{1}{2} \bigl(p - \operatorname{Tr}\bigl( P_1 (p \rho_0 - (1-p)\rho_1) \bigr)\bigr)\\ = \frac{1}{2} \operatorname{Tr}\bigl( (P_0-P_1) (p \rho_0 - (1-p)\rho_1)\bigr) + \frac{1}{2}

Teraz widać, dlaczego sensowne jest wybranie projekcji Π0\Pi_0 i Π1\Pi_1 (jak określono powyżej) dla P0P_0 i P1P_1 — bo właśnie tak możemy zmaksymalizować ślad w końcowym wyrażeniu. W szczególności

(Π0Π1)(pρ0(1p)ρ1)=k=0n1λkψkψk.(\Pi_0-\Pi_1) (p \rho_0 - (1-p)\rho_1) = \sum_{k = 0}^{n-1} \vert\lambda_k\vert \cdot \vert \psi_k \rangle \langle \psi_k \vert.

Gdy zatem obliczymy ślad, otrzymujemy sumę wartości bezwzględnych wartości własnych — co równa się temu, co znane jest jako trace norm ważonej różnicy.

Tr((Π0Π1)(pρ0(1p)ρ1))=k=0n1λk=pρ0(1p)ρ11\operatorname{Tr}\bigl( (\Pi_0-\Pi_1) (p \rho_0 - (1-p)\rho_1)\bigr) = \sum_{k = 0}^{n-1} \vert\lambda_k\vert = \bigl\| p \rho_0 - (1-p)\rho_1 \bigr\|_1

Zatem prawdopodobieństwo, że pomiar {Π0,Π1}\{\Pi_0,\Pi_1\} prowadzi do poprawnej dyskryminacji ρ0\rho_0 i ρ1,\rho_1, dane z prawdopodobieństwami pp i 1p1-p odpowiednio, wynosi:

12+12pρ0(1p)ρ11\frac{1}{2} + \frac{1}{2} \bigl\| p \rho_0 - (1-p)\rho_1 \bigr\|_1

Fakt, że jest to optymalne prawdopodobieństwo poprawnej dyskryminacji ρ0\rho_0 i ρ1,\rho_1, dane z prawdopodobieństwami pp i 1p,1-p, jest powszechnie określany jako twierdzenie Helstroma–Holevo (lub czasem po prostu twierdzenie Helstroma).

Dyskryminacja trzech lub więcej stanów

W przypadku dyskryminacji stanów kwantowych, gdy mamy do czynienia z trzema lub większą liczbą stanów, nie jest znane żadne zamknięte wyrażenie analityczne na optymalny pomiar, choć możliwe jest sformułowanie tego problemu jako program semidefinitowy — co pozwala na efektywne numeryczne aproksymacje optymalnych pomiarów przy pomocy komputera.

Możliwe jest również weryfikowanie (lub falsyfikowanie) optymalności danego pomiaru w zadaniu dyskryminacji stanów za pomocą warunku zwanego warunkiem Holevo-Yuen-Kennedy-Lax. W szczególności, dla zadania dyskryminacji stanów zdefiniowanego przez ensemble

{(p0,ρ0),,(pm1,ρm1)},\{(p_0,\rho_0),\ldots,(p_{m-1},\rho_{m-1})\},

pomiar {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} jest optymalny wtedy i tylko wtedy, gdy macierz

Qa=b=0m1pbρbPbpaρaQ_a = \sum_{b = 0}^{m-1} p_b \rho_b P_b - p_a \rho_a

jest dodatnio półokreślona dla każdego a{0,,m1}.a\in\{0,\ldots,m-1\}.

Rozważmy na przykład zadanie dyskryminacji stanów kwantowych, w którym jeden z czterech stanów czworościennych ϕ0,,ϕ3\vert\phi_0\rangle,\ldots,\vert\phi_3\rangle jest wybierany jednostajnie losowo. Pomiar czworościenny {P0,P1,P2,P3}\{P_0,P_1,P_2,P_3\} odnosi sukces z prawdopodobieństwem

14Tr(P0ϕ0ϕ0)+14Tr(P1ϕ1ϕ1)+14Tr(P2ϕ2ϕ2)+14Tr(P3ϕ3ϕ3)=12.\frac{1}{4} \operatorname{Tr}(P_0 \vert\phi_0\rangle\langle \phi_0 \vert) + \frac{1}{4} \operatorname{Tr}(P_1 \vert\phi_1\rangle\langle \phi_1 \vert) + \frac{1}{4} \operatorname{Tr}(P_2 \vert\phi_2\rangle\langle \phi_2 \vert) + \frac{1}{4} \operatorname{Tr}(P_3 \vert\phi_3\rangle\langle \phi_3 \vert) = \frac{1}{2}.

Jest to optymalne na mocy warunku Holevo-Yuen-Kennedy-Lax, co można sprawdzić obliczając, że

Qa=14(Iϕaϕa)0Q_a = \frac{1}{4}(\mathbb{I} - \vert\phi_a\rangle\langle\phi_a\vert) \geq 0

dla a=0,1,2,3.a = 0,1,2,3.

Kwantowa tomografia stanów

Na koniec omówimy pokrótce problem kwantowej tomografii stanów. W tym problemie dysponujesz dużą liczbą NN niezależnych kopii nieznanego stanu kwantowego ρ,\rho, a celem jest zrekonstruowanie aproksymacji ρ~\tilde{\rho} stanu ρ.\rho. Mówiąc wprost, chodzi o znalezienie klasycznego opisu density matrix ρ~\tilde{\rho} możliwie jak najbliższej ρ.\rho.

Możemy też opisać tę sytuację w następujący sposób. Wybierana jest nieznana density matrix ρ,\rho, a my mamy dostęp do NN układów kwantowych X1,,XN,\mathsf{X}_1,\ldots,\mathsf{X}_N, z których każdy został niezależnie przygotowany w stanie ρ.\rho. A zatem stan złożonego układu (X1,,XN)(\mathsf{X}_1,\ldots,\mathsf{X}_N) wynosi

ρN=ρρρ(N razy)\rho^{\otimes N} = \rho \otimes \rho \otimes \cdots \otimes \rho \quad \text{($N$ razy)}

Celem jest wykonanie pomiarów na układach X1,,XN\mathsf{X}_1,\ldots,\mathsf{X}_N i — na podstawie wyników tych pomiarów — obliczenie density matrix ρ~\tilde{\rho} blisko aproksymującej ρ.\rho. Okazuje się, że jest to fascynujący problem i wciąż jest on przedmiotem aktywnych badań.

Można rozważać różne typy strategii podejścia do tego problemu. Na przykład możemy wyobrazić sobie strategię, w której każdy z układów X1,,XN\mathsf{X}_1,\ldots,\mathsf{X}_N jest mierzony osobno, kolejno, dając ciąg wyników pomiarów. Możliwe są różne konkretne wybory dotyczące tego, jakie pomiary są wykonywane, w tym wybory adaptacyjne i nieadaptacyjne. Innymi słowy, wybór pomiaru wykonywanego na danym układzie może, lecz nie musi zależeć od wyników wcześniejszych pomiarów. Na podstawie ciągu wyników pomiarów wyznaczana jest zgadywana wartość ρ~\tilde{\rho} stanu ρ\rho — i tu również istnieją różne metodologie.

Alternatywnym podejściem jest wykonanie pojedynczego pomiaru łącznego na całej kolekcji, gdzie traktujemy (X1,,XN)(\mathsf{X}_1,\ldots,\mathsf{X}_N) jako jeden układ i wybieramy jeden pomiar, którego wynik stanowi aproksymację ρ~\tilde{\rho} stanu ρ.\rho. Może to prowadzić do lepszego oszacowania niż to, co jest możliwe przy osobnych pomiarach poszczególnych układów, choć łączny pomiar na wszystkich układach jednocześnie jest zapewne znacznie trudniejszy do zrealizowania w praktyce.

Tomografia qubitów przy użyciu pomiarów Pauli

Rozważymy teraz kwantową tomografię stanów w prostym przypadku, gdy ρ\rho jest qubitową density matrix. Zakładamy, że mamy dane kubity X1,,XN,\mathsf{X}_1,\ldots,\mathsf{X}_N, z których każdy jest niezależnie w stanie ρ,\rho, a naszym celem jest obliczenie aproksymacji ρ~\tilde{\rho} bliskiej ρ.\rho.

Nasza strategia polega na podzieleniu NN qubitów X1,,XN\mathsf{X}_1,\ldots,\mathsf{X}_N na trzy mniej więcej równoliczne kolekcje, po jednej na każdą z trzech macierzy Pauli σx,\sigma_x, σy,\sigma_y, oraz σz.\sigma_z. Każdy qubit jest następnie mierzony niezależnie w sposób opisany poniżej.

  1. Dla każdego z qubitów z kolekcji powiązanej z σx\sigma_x wykonujemy pomiar σx\sigma_x. Oznacza to, że qubit jest mierzony względem bazy {+,},\{\vert + \rangle, \vert -\rangle\}, która jest ortonormalną bazą wektorów własnych σx,\sigma_x, a odpowiadające wyniki pomiarów to wartości własne przypisane obu wektorom własnym: +1+1 dla stanu +\vert + \rangle i 1-1 dla stanu .\vert -\rangle. Uśredniając wyniki po wszystkich stanach z kolekcji powiązanej z σx,\sigma_x, otrzymujemy aproksymację wartości oczekiwanej

    +ρ+ρ=Tr(σxρ).\langle + \vert \rho \vert + \rangle - \langle - \vert \rho \vert - \rangle = \operatorname{Tr}(\sigma_x \rho).
  2. Dla każdego z qubitów z kolekcji powiązanej z σy\sigma_y wykonujemy pomiar σy\sigma_y. Taki pomiar jest podobny do pomiaru σx,\sigma_x, z tym że bazą pomiarową jest { ⁣+ ⁣i, ⁣ ⁣i},\{\vert\! +\!i \rangle, \vert\! -\!i \rangle\}, czyli wektory własne σy.\sigma_y. Uśredniając wyniki po wszystkich stanach z kolekcji powiązanej z σy,\sigma_y, otrzymujemy aproksymację wartości oczekiwanej

    +iρ ⁣+ ⁣iiρ ⁣ ⁣i=Tr(σyρ).\langle +i \vert \rho \vert \!+\!i \rangle - \langle -i \vert \rho \vert \!-\!i \rangle = \operatorname{Tr}(\sigma_y \rho).
  3. Dla każdego z qubitów z kolekcji powiązanej z σz\sigma_z wykonujemy pomiar σz\sigma_z. Tym razem bazą pomiarową jest baza standardowa {0,1},\{\vert 0\rangle, \vert 1 \rangle\}, czyli wektory własne σz.\sigma_z. Uśredniając wyniki po wszystkich stanach z kolekcji powiązanej z σz,\sigma_z, otrzymujemy aproksymację wartości oczekiwanej

    0ρ01ρ1=Tr(σzρ).\langle 0 \vert \rho \vert 0 \rangle - \langle 1 \vert \rho \vert 1 \rangle = \operatorname{Tr}(\sigma_z \rho).

Po uzyskaniu aproksymacji

αxTr(σxρ),  αyTr(σyρ),  αzTr(σzρ)\alpha_x \approx \operatorname{Tr}(\sigma_x \rho),\; \alpha_y \approx \operatorname{Tr}(\sigma_y \rho),\; \alpha_z \approx \operatorname{Tr}(\sigma_z \rho)

przez uśrednienie wyników pomiarów dla każdej kolekcji, możemy aproksymować ρ\rho jako

ρ~=I+αxσx+αyσy+αzσz2I+Tr(σxρ)σx+Tr(σyρ)σy+Tr(σzρ)σz2=ρ.\tilde{\rho} = \frac{\mathbb{I} + \alpha_x \sigma_x + \alpha_y \sigma_y + \alpha_z \sigma_z}{2} \approx \frac{\mathbb{I} + \operatorname{Tr}(\sigma_x \rho) \sigma_x + \operatorname{Tr}(\sigma_y \rho) \sigma_y + \operatorname{Tr}(\sigma_z \rho) \sigma_z}{2} = \rho.

W granicy, gdy NN dąży do nieskończoności, ta aproksymacja zbiega według prawdopodobieństwa do prawdziwej density matrix ρ\rho na mocy prawa wielkich liczb, a dobrze znane ograniczenia statystyczne (takie jak nierówność Hoeffdinga) mogą być używane do ograniczania prawdopodobieństwa, że aproksymacja ρ~\tilde{\rho} odchyla się od ρ\rho o zadaną wielkość.

Ważną rzeczą do dostrzeżenia jest jednak to, że macierz ρ~\tilde{\rho} uzyskana w ten sposób może nie być density matrix. W szczególności, choć zawsze będzie miała ślad równy 1,1, może nie być dodatnio półokreślona. Istnieją różne znane strategie „zaokrąglania" takiej aproksymacji ρ~\tilde{\rho} do density matrix — jedna z nich polega na obliczeniu rozkładu spektralnego, zastąpieniu ujemnych wartości własnych zerami, a następnie renormalizacji (przez podzielenie otrzymanej macierzy przez jej ślad).

Qubit tomography using the tetrahedral measurement

Inną opcją przeprowadzania tomografii qubitów jest pomiar każdego kubitu X1,,XN\mathsf{X}_1,\ldots,\mathsf{X}_N za pomocą pomiaru tetraedrycznego {P0,P1,P2,P3}\{P_0,P_1,P_2,P_3\} opisanego wcześniej. Czyli,

P0=ϕ0ϕ02,P1=ϕ1ϕ12,P2=ϕ2ϕ22,P3=ϕ3ϕ32P_0 = \frac{\vert \phi_0 \rangle \langle \phi_0 \vert}{2}, \quad P_1 = \frac{\vert \phi_1 \rangle \langle \phi_1 \vert}{2}, \quad P_2 = \frac{\vert \phi_2 \rangle \langle \phi_2 \vert}{2}, \quad P_3 = \frac{\vert \phi_3 \rangle \langle \phi_3 \vert}{2}

dla

ϕ0=0ϕ1=130+231ϕ2=130+23e2πi/31ϕ3=130+23e2πi/31.\begin{aligned} \vert \phi_0 \rangle & = \vert 0 \rangle\\ \vert \phi_1 \rangle & = \frac{1}{\sqrt{3}} \vert 0 \rangle + \sqrt{\frac{2}{3}} \vert 1 \rangle\\ \vert \phi_2 \rangle & = \frac{1}{\sqrt{3}} \vert 0 \rangle + \sqrt{\frac{2}{3}} e^{2\pi i/3} \vert 1 \rangle\\ \vert \phi_3 \rangle & = \frac{1}{\sqrt{3}} \vert 0 \rangle + \sqrt{\frac{2}{3}} e^{-2\pi i/3} \vert 1 \rangle. \end{aligned}

Każdy wynik jest uzyskiwany pewną liczbę razy, którą będziemy oznaczać jako nan_a dla każdego a{0,1,2,3},a\in\{0,1,2,3\}, tak że n0+n1+n2+n3=N.n_0 + n_1 + n_2 + n_3 = N. Stosunek tych liczb do NN daje przybliżenie prawdopodobieństwa związanego z każdym możliwym wynikiem:

naNTr(Paρ).\frac{n_a}{N} \approx \operatorname{Tr}(P_a \rho).

Na koniec skorzystamy z następującego niezwykłego wzoru:

ρ=a=03(3Tr(Paρ)12)ϕaϕa.\rho = \sum_{a=0}^3 \Bigl( 3 \operatorname{Tr}(P_a \rho) - \frac{1}{2}\Bigr) \vert \phi_a \rangle \langle \phi_a \vert.

Aby uzasadnić ten wzór, możemy skorzystać z poniższego równania dla kwadratów wartości bezwzględnych iloczynów skalarnych stanów tetraedrycznych, które można zweryfikować przez bezpośrednie obliczenia.

ϕaϕb2={1a=b13ab.\bigl\vert \langle \phi_a \vert \phi_b \rangle \bigr\vert^2 = \begin{cases} 1 & a=b\\ \frac{1}{3} & a\neq b. \end{cases}

Cztery macierze

ϕ0ϕ0=(1000)ϕ1ϕ1=(13232323)ϕ2ϕ2=(1323e2πi/323e2πi/323)ϕ3ϕ3=(1323e2πi/323e2πi/323)\begin{aligned} \vert\phi_0\rangle \langle \phi_0 \vert & = \begin{pmatrix} 1 & 0\\[2mm] 0 & 0\end{pmatrix}\\[3mm] \vert\phi_1\rangle \langle \phi_1 \vert & = \begin{pmatrix} \frac{1}{3} & \frac{\sqrt{2}}{3}\\[2mm] \frac{\sqrt{2}}{3} & \frac{2}{3}\end{pmatrix}\\[3mm] \vert\phi_2\rangle \langle \phi_2 \vert & = \begin{pmatrix} \frac{1}{3} & \frac{\sqrt{2}}{3}e^{-2\pi i/3}\\[2mm] \frac{\sqrt{2}}{3}e^{2\pi i/3} & \frac{2}{3}\end{pmatrix}\\[3mm] \vert\phi_3\rangle \langle \phi_3 \vert & = \begin{pmatrix} \frac{1}{3} & \frac{\sqrt{2}}{3}e^{2\pi i/3}\\[2mm] \frac{\sqrt{2}}{3}e^{-2\pi i/3} & \frac{2}{3}\end{pmatrix} \end{aligned}

są liniowo niezależne, więc wystarczy udowodnić, że wzór jest prawdziwy dla ρ=ϕbϕb\rho = \vert\phi_b\rangle\langle\phi_b\vert dla b=0,1,2,3.b = 0,1,2,3. W szczególności,

3Tr(Paϕbϕb)12=32ϕaϕb212={1a=b0ab3 \operatorname{Tr}(P_a \vert\phi_b\rangle\langle\phi_b\vert) - \frac{1}{2} = \frac{3}{2} \vert \langle \phi_a \vert \phi_b \rangle \vert^2 - \frac{1}{2} = \begin{cases} 1 & a=b\\ 0 & a\neq b \end{cases}

i w związku z tym

a=03(3Tr(Paϕbϕb)Tr(ϕbϕb)2)ϕaϕa=ϕbϕb.\sum_{a=0}^3 \biggl( 3 \operatorname{Tr}(P_a \vert\phi_b\rangle\langle\phi_b\vert) - \frac{\operatorname{Tr}(\vert\phi_b\rangle\langle\phi_b\vert)}{2}\biggr) \vert \phi_a \rangle \langle \phi_a \vert = \vert \phi_b\rangle\langle \phi_b \vert.

Otrzymujemy przybliżenie ρ:\rho:

ρ~=a=03(3naN12)ϕaϕa.\tilde{\rho} = \sum_{a=0}^3 \Bigl( \frac{3 n_a}{N} - \frac{1}{2}\Bigr) \vert \phi_a \rangle \langle \phi_a \vert.

To przybliżenie zawsze będzie macierzą Hermitian o śladzie równym jeden, jednak może nie być dodatnio półokreślone.