W ostatniej części lekcji krótko omówimy dwa zadania związane z pomiarami: dyskryminację stanów kwantowych i tomografię stanów kwantowych.
Dyskryminacja stanów kwantowych
W dyskryminacji stanów kwantowych dysponujemy znanym zbiorem stanów kwantowych ρ0,…,ρm−1, wraz z
prawdopodobieństwami p0,…,pm−1 przypisanymi do tych stanów.
Zwięzłym sposobem wyrażenia tego jest stwierdzenie, że mamy ensemble
{(p0,ρ0),…,(pm−1,ρm−1)}
stanów kwantowych.
Liczba a∈{0,…,m−1} jest wybierana losowo zgodnie z prawdopodobieństwami (p0,…,pm−1), a układ X
jest przygotowywany w stanie ρa.
Celem jest ustalenie, za pomocą pomiaru samego X, która wartość a została wybrana.
Mamy więc skończoną liczbę alternatyw wraz z prior — czyli naszą wiedzą o prawdopodobieństwie wyboru każdego a —
a celem jest ustalenie, która alternatywa faktycznie zaszła.
Dla jednych wyborów stanów i prawdopodobieństw może to być łatwe, dla innych może nie być możliwe bez pewnego ryzyka popełnienia błędu.
Tomografia stanów kwantowych
W tomografii stanów kwantowych mamy do czynienia z nieznanym stanem kwantowym układu —
więc w odróżnieniu od dyskryminacji stanów kwantowych zazwyczaj nie ma prior ani żadnych
informacji o możliwych alternatywach.
Tym razem jednak nie jest dostępna pojedyncza kopia stanu,
lecz wiele niezależnych kopii.
To znaczy, N identycznych układów X1,…,XN jest każdy
niezależnie przygotowywany w stanie ρ dla pewnej (możliwie dużej) liczby N.
Celem jest znalezienie przybliżenia nieznanego stanu, jako density matrix,
poprzez pomiar tych układów.
Najprostszym przypadkiem dyskryminacji stanów kwantowych jest sytuacja, w której rozróżniamy dwa stany,
ρ0 i ρ1.
Wyobraź sobie sytuację, w której bit a jest wybierany losowo: a=0 z prawdopodobieństwem p i a=1 z prawdopodobieństwem 1−p.
Układ X jest przygotowywany w stanie ρa, czyli ρ0 lub ρ1 w zależności od wartości a, i przekazywany nam.
Naszym celem jest poprawne odgadnięcie wartości a za pomocą pomiaru na X.
Dokładniej, będziemy dążyć do zmaksymalizowania prawdopodobieństwa, że nasze przypuszczenie jest poprawne.
Optymalny sposób rozwiązania tego problemu zaczyna się od rozkładu spektralnego ważonej różnicy między ρ0 i ρ1, gdzie wagi to odpowiednie prawdopodobieństwa.
pρ0−(1−p)ρ1=k=0∑n−1λk∣ψk⟩⟨ψk∣
Zauważ, że mamy znak minus zamiast znaku plus w tym wyrażeniu: jest to ważona różnica, a nie ważona suma.
Możemy zmaksymalizować prawdopodobieństwo poprawnego odgadnięcia, wybierając projective measurement {Π0,Π1} w następujący sposób.
Najpierw podzielmy elementy zbioru {0,…,n−1} na dwa rozłączne zbiory S0 i S1 w zależności od tego, czy odpowiadająca wartość własna ważonej różnicy jest nieujemna, czy ujemna.
S0={k∈{0,…,n−1}:λk≥0}S1={k∈{0,…,n−1}:λk<0}
Możemy wówczas wybrać projective measurement w następujący sposób.
Π0=k∈S0∑∣ψk⟩⟨ψk∣andΠ1=k∈S1∑∣ψk⟩⟨ψk∣
(W rzeczywistości nie ma znaczenia, do którego ze zbiorów S0 lub S1 włączymy wartości k, dla których λk=0.
Tutaj arbitralnie włączamy te wartości do S0.)
Jest to optymalny pomiar w tej sytuacji, minimalizujący prawdopodobieństwo błędnego określenia wybranego stanu.
Teraz wyznaczymy prawdopodobieństwo poprawności dla pomiaru {Π0,Π1}.
Na początek nie musimy się zbytnio skupiać na konkretnym wyborze Π0 i Π1, choć warto o nim pamiętać.
Dla dowolnego pomiaru {P0,P1} (niekoniecznie projective) możemy zapisać prawdopodobieństwo poprawności następująco.
pTr(P0ρ0)+(1−p)Tr(P1ρ1)
Korzystając z faktu, że {P0,P1} jest pomiarem, więc P1=I−P0, możemy przepisać to wyrażenie w następujący sposób.
Oba wyrażenia mają tę samą wartość, więc możemy je uśrednić, uzyskując jeszcze inne wyrażenie dla tej wartości.
(Uśrednianie obu wyrażeń to jedynie trick mający uprościć wynikowe wyrażenie.)
Teraz widać, dlaczego sensowne jest wybranie projekcji Π0 i Π1 (jak określono powyżej) dla P0 i P1 — bo właśnie tak możemy zmaksymalizować ślad w końcowym wyrażeniu.
W szczególności
Gdy zatem obliczymy ślad, otrzymujemy sumę wartości bezwzględnych wartości własnych — co równa się temu, co znane jest jako trace norm ważonej różnicy.
Zatem prawdopodobieństwo, że pomiar {Π0,Π1} prowadzi do poprawnej dyskryminacji ρ0 i ρ1, dane z prawdopodobieństwami p i 1−p odpowiednio, wynosi:
21+21pρ0−(1−p)ρ11
Fakt, że jest to optymalne prawdopodobieństwo poprawnej dyskryminacji ρ0 i ρ1, dane z prawdopodobieństwami p i 1−p, jest powszechnie określany jako twierdzenie Helstroma–Holevo (lub czasem po prostu twierdzenie Helstroma).
W przypadku dyskryminacji stanów kwantowych, gdy mamy do czynienia z trzema lub większą liczbą stanów, nie jest znane żadne zamknięte wyrażenie analityczne na optymalny pomiar, choć możliwe jest sformułowanie tego problemu jako program semidefinitowy — co pozwala na efektywne numeryczne aproksymacje optymalnych pomiarów przy pomocy komputera.
Możliwe jest również weryfikowanie (lub falsyfikowanie) optymalności danego pomiaru w zadaniu dyskryminacji stanów za pomocą warunku zwanego warunkiem Holevo-Yuen-Kennedy-Lax.
W szczególności, dla zadania dyskryminacji stanów zdefiniowanego przez ensemble
{(p0,ρ0),…,(pm−1,ρm−1)},
pomiar {P0,…,Pm−1} jest optymalny wtedy i tylko wtedy, gdy macierz
Qa=b=0∑m−1pbρbPb−paρa
jest dodatnio półokreślona dla każdego a∈{0,…,m−1}.
Rozważmy na przykład zadanie dyskryminacji stanów kwantowych, w którym jeden z czterech stanów czworościennych ∣ϕ0⟩,…,∣ϕ3⟩ jest wybierany jednostajnie losowo.
Pomiar czworościenny {P0,P1,P2,P3} odnosi sukces z prawdopodobieństwem
Na koniec omówimy pokrótce problem kwantowej tomografii stanów.
W tym problemie dysponujesz dużą liczbą N niezależnych kopii nieznanego stanu kwantowego ρ, a celem jest zrekonstruowanie aproksymacji ρ~ stanu ρ.
Mówiąc wprost, chodzi o znalezienie klasycznego opisu density matrix ρ~ możliwie jak najbliższej ρ.
Możemy też opisać tę sytuację w następujący sposób.
Wybierana jest nieznana density matrix ρ, a my mamy dostęp do N układów kwantowych X1,…,XN, z których każdy został niezależnie przygotowany w stanie ρ.
A zatem stan złożonego układu (X1,…,XN) wynosi
ρ⊗N=ρ⊗ρ⊗⋯⊗ρ(N razy)
Celem jest wykonanie pomiarów na układach X1,…,XN i — na podstawie wyników tych pomiarów — obliczenie density matrix ρ~ blisko aproksymującej ρ.
Okazuje się, że jest to fascynujący problem i wciąż jest on przedmiotem aktywnych badań.
Można rozważać różne typy strategii podejścia do tego problemu.
Na przykład możemy wyobrazić sobie strategię, w której każdy z układów X1,…,XN jest mierzony osobno, kolejno, dając ciąg wyników pomiarów.
Możliwe są różne konkretne wybory dotyczące tego, jakie pomiary są wykonywane, w tym wybory adaptacyjne i nieadaptacyjne.
Innymi słowy, wybór pomiaru wykonywanego na danym układzie może, lecz nie musi zależeć od wyników wcześniejszych pomiarów.
Na podstawie ciągu wyników pomiarów wyznaczana jest zgadywana wartość ρ~ stanu ρ — i tu również istnieją różne metodologie.
Alternatywnym podejściem jest wykonanie pojedynczego pomiaru łącznego na całej kolekcji, gdzie traktujemy (X1,…,XN) jako jeden układ i wybieramy jeden pomiar, którego wynik stanowi aproksymację ρ~ stanu ρ.
Może to prowadzić do lepszego oszacowania niż to, co jest możliwe przy osobnych pomiarach poszczególnych układów, choć łączny pomiar na wszystkich układach jednocześnie jest zapewne znacznie trudniejszy do zrealizowania w praktyce.
Rozważymy teraz kwantową tomografię stanów w prostym przypadku, gdy ρ jest qubitową density matrix.
Zakładamy, że mamy dane kubity X1,…,XN, z których każdy jest niezależnie w stanie ρ, a naszym celem jest obliczenie aproksymacji ρ~ bliskiej ρ.
Nasza strategia polega na podzieleniu N qubitów X1,…,XN na trzy mniej więcej równoliczne kolekcje, po jednej na każdą z trzech macierzy Pauli σx,σy, oraz σz.
Każdy qubit jest następnie mierzony niezależnie w sposób opisany poniżej.
Dla każdego z qubitów z kolekcji powiązanej z σx wykonujemy pomiar σx. Oznacza to, że qubit jest mierzony względem bazy {∣+⟩,∣−⟩}, która jest ortonormalną bazą wektorów własnych σx, a odpowiadające wyniki pomiarów to wartości własne przypisane obu wektorom własnym: +1 dla stanu ∣+⟩ i −1 dla stanu ∣−⟩. Uśredniając wyniki po wszystkich stanach z kolekcji powiązanej z σx, otrzymujemy aproksymację wartości oczekiwanej
⟨+∣ρ∣+⟩−⟨−∣ρ∣−⟩=Tr(σxρ).
Dla każdego z qubitów z kolekcji powiązanej z σy wykonujemy pomiar σy. Taki pomiar jest podobny do pomiaru σx, z tym że bazą pomiarową jest {∣+i⟩,∣−i⟩}, czyli wektory własne σy. Uśredniając wyniki po wszystkich stanach z kolekcji powiązanej z σy, otrzymujemy aproksymację wartości oczekiwanej
⟨+i∣ρ∣+i⟩−⟨−i∣ρ∣−i⟩=Tr(σyρ).
Dla każdego z qubitów z kolekcji powiązanej z σz wykonujemy pomiar σz. Tym razem bazą pomiarową jest baza standardowa {∣0⟩,∣1⟩}, czyli wektory własne σz. Uśredniając wyniki po wszystkich stanach z kolekcji powiązanej z σz, otrzymujemy aproksymację wartości oczekiwanej
⟨0∣ρ∣0⟩−⟨1∣ρ∣1⟩=Tr(σzρ).
Po uzyskaniu aproksymacji
αx≈Tr(σxρ),αy≈Tr(σyρ),αz≈Tr(σzρ)
przez uśrednienie wyników pomiarów dla każdej kolekcji, możemy aproksymować ρ jako
W granicy, gdy N dąży do nieskończoności, ta aproksymacja zbiega według prawdopodobieństwa do prawdziwej density matrix ρ na mocy prawa wielkich liczb, a dobrze znane ograniczenia statystyczne (takie jak nierówność Hoeffdinga) mogą być używane do ograniczania prawdopodobieństwa, że aproksymacja ρ~ odchyla się od ρ o zadaną wielkość.
Ważną rzeczą do dostrzeżenia jest jednak to, że macierz ρ~ uzyskana w ten sposób może nie być density matrix.
W szczególności, choć zawsze będzie miała ślad równy 1, może nie być dodatnio półokreślona.
Istnieją różne znane strategie „zaokrąglania" takiej aproksymacji ρ~ do density matrix — jedna z nich polega na obliczeniu rozkładu spektralnego, zastąpieniu ujemnych wartości własnych zerami, a następnie renormalizacji (przez podzielenie otrzymanej macierzy przez jej ślad).
Qubit tomography using the tetrahedral measurement
Inną opcją przeprowadzania tomografii qubitów jest pomiar każdego kubitu X1,…,XN za pomocą pomiaru tetraedrycznego
{P0,P1,P2,P3} opisanego wcześniej.
Czyli,
Każdy wynik jest uzyskiwany pewną liczbę razy, którą będziemy oznaczać jako na dla każdego a∈{0,1,2,3}, tak że n0+n1+n2+n3=N.
Stosunek tych liczb do N daje przybliżenie prawdopodobieństwa związanego z każdym możliwym wynikiem:
Nna≈Tr(Paρ).
Na koniec skorzystamy z następującego niezwykłego wzoru:
ρ=a=0∑3(3Tr(Paρ)−21)∣ϕa⟩⟨ϕa∣.
Aby uzasadnić ten wzór, możemy skorzystać z poniższego równania dla kwadratów wartości bezwzględnych iloczynów skalarnych stanów tetraedrycznych, które można zweryfikować przez bezpośrednie obliczenia.