Aby lepiej przygotować się do zgłębiania możliwości i ograniczeń obwodów kwantowych, wprowadzamy teraz kilka dodatkowych pojęć matematycznych — mianowicie iloczyn skalarny między wektorami (oraz jego związek z normą euklidesową), pojęcia ortogonalności i ortonormalności dla zbiorów wektorów, a także macierze rzutowania, które pozwolą nam wprowadzić poręczne uogólnienie standardowych pomiarów w bazie.
Przypomnijmy, że kiedy używamy notacji Diraca do oznaczenia dowolnego wektora kolumnowego jako ket, na przykład
∣ψ⟩=α1α2⋮αn,
odpowiadający mu wektor bra jest sprzężeniem hermitowskim (transpozycją sprzężoną) tego wektora:
⟨ψ∣=(∣ψ⟩)†=(α1α2⋯αn).(1)
Alternatywnie, jeśli mamy na myśli pewien zbiór stanów klasycznych Σ i wyrażamy wektor kolumnowy jako ket,
na przykład
∣ψ⟩=a∈Σ∑αa∣a⟩,
to odpowiadający mu wektor wierszowy (lub bra) jest sprzężeniem hermitowskim
⟨ψ∣=a∈Σ∑αa⟨a∣.(2)
Mamy także, że iloczyn wektora bra i wektora ket, traktowanych jako macierze mające odpowiednio jeden wiersz lub jedną kolumnę, daje skalar.
Konkretnie, jeśli mamy dwa wektory kolumnowe
∣ψ⟩=α1α2⋮αnoraz∣ϕ⟩=β1β2⋮βn,
tak że wektor wierszowy ⟨ψ∣ jest taki jak w równaniu (1), to
gdzie ostatnia równość wynika z obserwacji, że ⟨a∣a⟩=1 oraz ⟨a∣b⟩=0 dla stanów klasycznych a i b spełniających a=b.
Wartość ⟨ψ∣ϕ⟩ nazywana jest iloczynem skalarnym wektorów ∣ψ⟩ i ∣ϕ⟩.
Iloczyny skalarne mają kluczowe znaczenie w informacji i obliczeniach kwantowych;
nie moglibyśmy daleko zajść w rozumieniu informacji kwantowej na poziomie matematycznym bez nich.
Zbierzmy teraz razem kilka podstawowych faktów dotyczących iloczynów skalarnych wektorów.
Związek z normą euklidesową. Iloczyn skalarny dowolnego wektora
∣ψ⟩=a∈Σ∑αa∣a⟩
z samym sobą wynosi
⟨ψ∣ψ⟩=a∈Σ∑αaαa=a∈Σ∑∣αa∣2=∣ψ⟩2.
Zatem normę euklidesową wektora można alternatywnie wyrazić jako
∣ψ⟩=⟨ψ∣ψ⟩.
Zauważmy, że norma euklidesowa wektora musi być zawsze nieujemną liczbą rzeczywistą.
Co więcej, jedynym sposobem, aby norma euklidesowa wektora była równa zero, jest to, że każdy z jego elementów jest równy zeru, czyli że wektor jest wektorem zerowym.
Możemy podsumować te obserwacje w następujący sposób: dla każdego wektora ∣ψ⟩ mamy
⟨ψ∣ψ⟩≥0,
przy czym ⟨ψ∣ψ⟩=0 wtedy i tylko wtedy, gdy ∣ψ⟩=0.
Ta własność iloczynu skalarnego jest czasami nazywana dodatnią określonością.
Symetria sprzężona. Dla dowolnych dwóch wektorów
∣ψ⟩=a∈Σ∑αa∣a⟩oraz∣ϕ⟩=b∈Σ∑βb∣b⟩,
mamy
⟨ψ∣ϕ⟩=a∈Σ∑αaβaoraz⟨ϕ∣ψ⟩=a∈Σ∑βaαa,
a zatem
⟨ψ∣ϕ⟩=⟨ϕ∣ψ⟩.
Liniowość w drugim argumencie (i liniowość sprzężona w pierwszym).
Załóżmy, że ∣ψ⟩,∣ϕ1⟩ oraz ∣ϕ2⟩ są wektorami, a α1 i α2 są liczbami zespolonymi. Jeśli zdefiniujemy nowy wektor
Oznacza to, że iloczyn skalarny jest liniowy w drugim argumencie.
Można to zweryfikować albo za pomocą powyższych wzorów, albo po prostu zauważając, że mnożenie macierzy jest liniowe w każdym argumencie (a w szczególności w drugim argumencie).
Połączenie tego faktu z symetrią sprzężoną ujawnia, że iloczyn skalarny jest sprzężenie liniowy w pierwszym argumencie. Oznacza to, że jeśli ∣ψ1⟩,∣ψ2⟩ oraz ∣ϕ⟩ są wektorami, a α1 i α2 są liczbami zespolonymi, i zdefiniujemy
Dwa wektory ∣ϕ⟩ i ∣ψ⟩ nazywamy ortogonalnymi, jeżeli ich iloczyn skalarny wynosi zero:
⟨ψ∣ϕ⟩=0.
Geometrycznie możemy myśleć o wektorach ortogonalnych jako o wektorach wzajemnie prostopadłych.
Zbiór wektorów {∣ψ1⟩,…,∣ψm⟩} nazywamy zbiorem ortogonalnym, jeżeli każdy wektor w tym zbiorze jest ortogonalny do każdego innego wektora w tym zbiorze.
Oznacza to, że zbiór ten jest ortogonalny, jeżeli
⟨ψj∣ψk⟩=0
dla wszystkich wyborów j,k∈{1,…,m}, dla których j=k.
Zbiór wektorów {∣ψ1⟩,…,∣ψm⟩} nazywamy zbiorem ortonormalnym, jeżeli jest zbiorem ortogonalnym i dodatkowo każdy wektor w tym zbiorze jest wektorem jednostkowym.
Alternatywnie, zbiór ten jest zbiorem ortonormalnym, jeżeli mamy
⟨ψj∣ψk⟩={10j=kj=k(3)
dla wszystkich wyborów j,k∈{1,…,m}.
Wreszcie, zbiór {∣ψ1⟩,…,∣ψm⟩} jest bazą ortonormalną, jeżeli oprócz tego, że jest zbiorem ortonormalnym, tworzy także bazę.
Jest to równoważne temu, że {∣ψ1⟩,…,∣ψm⟩} jest zbiorem ortonormalnym, a m jest równe wymiarowi przestrzeni, z której pochodzą wektory ∣ψ1⟩,…,∣ψm⟩.
Na przykład, dla dowolnego klasycznego zbioru stanów Σ, zbiór wszystkich wektorów bazy standardowej
{∣a⟩:a∈Σ}
jest bazą ortonormalną.
Zbiór {∣+⟩,∣−⟩} jest bazą ortonormalną dla 2-wymiarowej przestrzeni odpowiadającej pojedynczemu kubitowi, a baza Bella {∣ϕ+⟩,∣ϕ−⟩,∣ψ+⟩,∣ψ−⟩} jest bazą ortonormalną dla 4-wymiarowej przestrzeni odpowiadającej dwóm kubitom.
Rozszerzanie zbiorów ortonormalnych do baz ortonormalnych
Załóżmy, że ∣ψ1⟩,…,∣ψm⟩ są wektorami żyjącymi w n-wymiarowej przestrzeni, a ponadto załóżmy, że {∣ψ1⟩,…,∣ψm⟩} jest zbiorem ortonormalnym.
Zbiory ortonormalne są zawsze zbiorami liniowo niezależnymi, więc wektory te z konieczności rozpinają podprzestrzeń o wymiarze m.
Z tego wnioskujemy, że m≤n, ponieważ wymiar podprzestrzeni rozpiętej przez te wektory nie może być większy niż wymiar całej przestrzeni, z której są one pobrane.
Jeżeli zachodzi m<n, to zawsze możliwy jest wybór dodatkowych n−m wektorów
∣ψm+1⟩,…,∣ψn⟩ takich, aby
{∣ψ1⟩,…,∣ψn⟩} tworzył bazę ortonormalną.
Do skonstruowania tych wektorów można użyć procedury znanej jako proces ortogonalizacji Grama–Schmidta.
Zbiory wektorów ortonormalnych są ściśle powiązane z macierzami unitarnymi.
Jednym ze sposobów wyrażenia tego związku jest stwierdzenie, że następujące trzy stwierdzenia są logicznie równoważne (co oznacza, że są wszystkie prawdziwe lub wszystkie fałszywe) dla dowolnego wyboru macierzy kwadratowej U:
Macierz U jest unitarna (tzn. U†U=I=UU†).
Wiersze macierzy U tworzą zbiór ortonormalny.
Kolumny macierzy U tworzą zbiór ortonormalny.
Ta równoważność jest w zasadzie dość prosta, gdy zastanowimy się, jak działa mnożenie macierzy oraz sprzężenie hermitowskie (transpozycja sprzężona).
Załóżmy na przykład, że mamy macierz 3×3 postaci:
Odwołując się do równania (3), widzimy teraz, że warunek, aby ta macierz była równa macierzy jednostkowej, jest równoważny ortonormalności zbioru {∣ψ1⟩,∣ψ2⟩,∣ψ3⟩}.
Argument ten uogólnia się na macierze unitarne dowolnego rozmiaru.
Fakt, że wiersze macierzy tworzą bazę ortonormalną wtedy i tylko wtedy, gdy macierz jest unitarna, wynika wtedy z faktu, że macierz jest unitarna wtedy i tylko wtedy, gdy jej transpozycja jest unitarna.
Biorąc pod uwagę opisaną powyżej równoważność, wraz z faktem, że każdy zbiór ortonormalny można rozszerzyć do bazy ortonormalnej, otrzymujemy następujący użyteczny fakt:
Mając dowolny zbiór ortonormalny wektorów {∣ψ1⟩,…,∣ψm⟩} pochodzących z n-wymiarowej przestrzeni, istnieje macierz unitarna U, której pierwszych m kolumn stanowią wektory ∣ψ1⟩,…,∣ψm⟩.
Obrazowo, zawsze możemy znaleźć macierz unitarną tej postaci:
U=∣ψ1⟩∣ψ2⟩⋯∣ψm⟩∣ψm+1⟩⋯∣ψn⟩.
Tutaj ostatnie n−m kolumn jest wypełnione dowolnym wyborem wektorów ∣ψm+1⟩,…,∣ψn⟩, które sprawiają, że
{∣ψ1⟩,…,∣ψn⟩} jest bazą ortonormalną.
Macierz kwadratowa Π nazywana jest projekcją, jeśli spełnia dwie własności:
Π=Π†.
Π2=Π.
Macierze spełniające pierwszy warunek — że są równe swojemu sprzężeniu hermitowskiemu — nazywane są macierzami hermitowskimi, a macierze spełniające drugi warunek — że ich kwadrat pozostaje niezmieniony — nazywane są macierzami idempotentnymi.
Dla ostrożności warto zaznaczyć, że słowo projekcja bywa czasem używane w odniesieniu do dowolnej macierzy spełniającej jedynie drugi warunek, lecz niekoniecznie pierwszy, a w takim przypadku zazwyczaj używa się terminu projekcja ortogonalna w odniesieniu do macierzy spełniających obie własności.
W kontekście informacji i obliczeń kwantowych natomiast terminy projekcja oraz macierz projekcji zazwyczaj odnoszą się do macierzy spełniających oba warunki.
Przykładem projekcji jest macierz
Π=∣ψ⟩⟨ψ∣(4)
dla dowolnego wektora jednostkowego ∣ψ⟩.
Możemy zobaczyć, że ta macierz jest hermitowska w następujący sposób:
Π†=(∣ψ⟩⟨ψ∣)†=(⟨ψ∣)†(∣ψ⟩)†=∣ψ⟩⟨ψ∣=Π.
Tutaj, aby uzyskać drugą równość, skorzystaliśmy ze wzoru
(AB)†=B†A†,
który jest zawsze prawdziwy dla dowolnych dwóch macierzy A i B, dla których iloczyn AB ma sens.
Aby zobaczyć, że macierz Π z (4) jest idempotentna, możemy skorzystać z założenia, że ∣ψ⟩ jest wektorem jednostkowym, tak że spełnia ⟨ψ∣ψ⟩=1.
Zatem mamy
Π2=(∣ψ⟩⟨ψ∣)2=∣ψ⟩⟨ψ∣ψ⟩⟨ψ∣=∣ψ⟩⟨ψ∣=Π.
Bardziej ogólnie, jeśli {∣ψ1⟩,…,∣ψm⟩} jest dowolnym ortonormalnym zbiorem wektorów, to macierz
gdzie ortonormalność zbioru {∣ψ1⟩,…,∣ψm⟩} implikuje przedostatnią równość.
W istocie wyczerpuje to wszystkie możliwości: każdą projekcję Π można zapisać w postaci (5) dla pewnego wyboru zbioru ortonormalnego {∣ψ1⟩,…,∣ψm⟩}.
(Z technicznego punktu widzenia macierz zerowa Π=0, która jest projekcją, stanowi przypadek szczególny.
Aby dopasować ją do ogólnej postaci (5), musimy dopuścić możliwość, że suma jest pusta, co daje macierz zerową.)
Pojęcie pomiaru układu kwantowego jest bardziej ogólne niż tylko pomiary w bazie standardowej.
Pomiary projekcyjne to pomiary opisywane przez zbiór projekcji, których suma jest równa macierzy jednostkowej.
Symbolicznie, zbiór {Π0,…,Πm−1} macierzy projekcji opisuje pomiar projekcyjny, jeśli
Π0+⋯+Πm−1=I.
Kiedy taki pomiar jest wykonywany na układzie X, gdy znajduje się on w pewnym stanie ∣ψ⟩, dzieją się dwie rzeczy:
Dla każdego k∈{0,…,m−1}, wynikiem pomiaru jest k z prawdopodobieństwem równym
Pr(wynikiem jest k)=Πk∣ψ⟩2.
Niezależnie od tego, który wynik k daje pomiar, stan układu X staje się
Πk∣ψ⟩Πk∣ψ⟩.
Możemy również wybrać inne wyniki niż {0,…,m−1} dla pomiarów projekcyjnych, jeśli tak wolimy.
Bardziej ogólnie, dla dowolnego skończonego i niepustego zbioru Σ, jeśli mamy zbiór macierzy projekcji
{Πa:a∈Σ}
spełniający warunek
a∈Σ∑Πa=I,
to zbiór ten opisuje pomiar projekcyjny, którego możliwe wyniki pokrywają się ze zbiorem Σ, gdzie reguły są takie same jak poprzednio:
Dla każdego a∈Σ, wynikiem pomiaru jest a z prawdopodobieństwem równym
Pr(wynikiem jest a)=Πa∣ψ⟩2.
Niezależnie od tego, który wynik a daje pomiar, stan układu X staje się
Πa∣ψ⟩Πa∣ψ⟩.
Na przykład pomiary w bazie standardowej są równoważne pomiarom projekcyjnym, gdzie Σ jest zbiorem stanów klasycznych dowolnego układu X, o którym mówimy, a naszym zbiorem macierzy projekcji jest
{∣a⟩⟨a∣:a∈Σ}.
Innym przykładem pomiaru projekcyjnego, tym razem na dwóch kubitach (X,Y), jest zbiór
{Π0,Π1}, gdzie
Π0=∣ϕ+⟩⟨ϕ+∣+∣ϕ−⟩⟨ϕ−∣+∣ψ+⟩⟨ψ+∣iΠ1=∣ψ−⟩⟨ψ−∣.
Jeśli mamy wiele układów, które wspólnie znajdują się w pewnym stanie kwantowym, i pomiar projekcyjny jest wykonywany tylko na jednym z tych układów, działanie jest podobne do tego, co mieliśmy w przypadku pomiarów w bazie standardowej — i w rzeczywistości możemy teraz opisać to działanie znacznie prościej niż wcześniej.
Aby być precyzyjnym, załóżmy, że mamy dwa układy (X,Y) w stanie kwantowym ∣ψ⟩, a pomiar projekcyjny opisany przez zbiór {Πa:a∈Σ} jest wykonywany na układzie X, podczas gdy z układem Y nie dzieje się nic.
Wykonanie tego jest wówczas równoważne wykonaniu pomiaru projekcyjnego opisanego przez zbiór
{Πa⊗I:a∈Σ}
na układzie złożonym (X,Y).
Każdy wynik pomiaru a pojawia się z prawdopodobieństwem
(Πa⊗I)∣ψ⟩2,
a pod warunkiem uzyskania wyniku a, stan układu złożonego (X,Y) staje się
Dowolne pomiary projekcyjne mogą zostać zaimplementowane przy użyciu operacji unitarnych, pomiarów w bazie standardowej oraz dodatkowego systemu roboczego, co zostanie teraz wyjaśnione.
Załóżmy, że X jest systemem, a {Π0,…,Πm−1} jest pomiarem projekcyjnym na X. Możemy łatwo uogólnić tę dyskusję na pomiary projekcyjne mające różne zbiory wyników, ale dla wygody i prostoty założymy, że zbiór możliwych wyników naszego pomiaru to {0,…,m−1}.
Zauważmy wyraźnie, że m niekoniecznie jest równe liczbie klasycznych stanów X — niech n oznacza liczbę klasycznych stanów X, co oznacza, że każda macierz Πk jest macierzą projekcji n×n.
Ponieważ zakładamy, że {Π0…,Πm−1} reprezentuje pomiar projekcyjny, musi zachodzić
k=0∑m−1Πk=In.
Naszym celem jest wykonanie procesu, który ma taki sam efekt jak wykonanie tego pomiaru projekcyjnego na X, ale przy użyciu wyłącznie operacji unitarnych oraz pomiarów w bazie standardowej.
W tym celu skorzystamy z dodatkowego systemu roboczego Y, a konkretnie przyjmiemy, że klasyczny zbiór stanów Y to {0,…,m−1}, czyli taki sam jak zbiór wyników pomiaru projekcyjnego.
Pomysł polega na tym, że wykonamy pomiar w bazie standardowej na Y i zinterpretujemy wynik tego pomiaru jako równoważny wynikowi pomiaru projekcyjnego na X.
Będziemy musieli założyć, że Y jest zainicjalizowany do pewnego ustalonego stanu, którym wybierzemy ∣0⟩.
(Każdy inny wybór ustalonego wektora stanu kwantowego mógłby zadziałać, ale wybór ∣0⟩ znacznie upraszcza poniższe wyjaśnienie.)
Oczywiście, aby pomiar Y w bazie standardowej mógł powiedzieć nam cokolwiek o X, będziemy musieli umożliwić jakąś interakcję między X a Y przed pomiarem Y, wykonując operację unitarną na systemie (Y,X).
Rozważmy najpierw tę macierz:
M=k=0∑m−1∣k⟩⟨0∣⊗Πk.
Wyrażona jawnie jako tak zwana macierz blokowa, która w istocie jest macierzą macierzy interpretowaną jako jedna, większa macierz, M wygląda tak:
M=Π0Π1⋮Πm−100⋮0⋯⋯⋱⋯00⋮0.
Tutaj każde 0 reprezentuje macierz n×n wypełnioną w całości zerami, tak że cała macierz M jest macierzą nm×nm.
Otóż M z pewnością nie jest macierzą unitarną (chyba że m=1, w którym to przypadku Π0=I, co daje M=I w tym trywialnym przypadku), ponieważ macierze unitarne nie mogą mieć żadnych kolumn (ani wierszy) złożonych wyłącznie z 0; macierze unitarne mają kolumny tworzące bazy ortonormalne, a wektor samych zer nie jest wektorem jednostkowym.
Jednakże prawdą jest, że pierwsze n kolumn M jest ortonormalnych, co wynika z założenia, że {Π0,…,Πm−1} jest pomiarem.
Aby zweryfikować to stwierdzenie, zauważmy, że dla każdego j∈{0,…,n−1} wektor utworzony przez kolumnę numer j macierzy M jest następujący:
∣ψj⟩=M∣0,j⟩=k=0∑m−1∣k⟩⊗Πk∣j⟩.
Zauważmy, że numerujemy tutaj kolumny zaczynając od kolumny 0. Wzięcie iloczynu skalarnego kolumny i z kolumną j dla i,j∈{0,…,n−1} daje
Zatem, ponieważ pierwsze n kolumn macierzy M jest ortonormalne, możemy zastąpić wszystkie pozostałe zerowe wpisy innym wyborem wpisów będących liczbami zespolonymi, tak aby cała macierz była unitarna.
U=Π0Π1⋮Πm−1??⋮?⋯⋯⋱⋯??⋮?
Jeśli dane są nam macierze Π0,…,Πm−1, możemy obliczyć odpowiednie macierze wypełniające bloki oznaczone ? w równaniu — używając procesu Grama–Schmidta — ale dla potrzeb tej dyskusji nie ma znaczenia, jakie konkretnie są to macierze.
Na koniec możemy opisać proces pomiaru: najpierw wykonujemy U na połączonym systemie (Y,X), a następnie mierzymy Y względem pomiaru w bazie standardowej.
Dla dowolnego stanu ∣ϕ⟩ systemu X otrzymujemy stan
U(∣0⟩∣ϕ⟩)=M(∣0⟩∣ϕ⟩)=k=0∑m−1∣k⟩⊗Πk∣ϕ⟩,
gdzie pierwsza równość wynika z faktu, że U i M zgadzają się na swoich pierwszych n kolumnach.
Gdy wykonujemy pomiar projekcyjny na Y, otrzymujemy każdy wynik k z prawdopodobieństwem
Πk∣ϕ⟩2,
w którym to przypadku stan (Y,X) staje się
∣k⟩⊗Πk∣ϕ⟩Πk∣ϕ⟩.
W ten sposób Y przechowuje kopię wyniku pomiaru, a X zmienia się dokładnie tak, jakby pomiar projekcyjny opisany przez {Π0,…,Πm−1} został wykonany bezpośrednio na X.