Informacja klasyczna
Tak jak w poprzedniej lekcji, rozpoczniemy tę lekcję od omówienia informacji klasycznej. Po raz kolejny opisy probabilistyczny i kwantowy są matematycznie podobne, a rozpoznanie, jak działa matematyka w znajomym kontekście informacji klasycznej, pomaga zrozumieć, dlaczego informacja kwantowa jest opisywana w taki sposób, w jaki jest.
Stany klasyczne za pomocą iloczynu kartezjańskiego
Zaczniemy od bardzo podstawowego poziomu, od stanów klasycznych wielu systemów. Dla uproszczenia zaczniemy od omówienia tylko dwóch systemów, a następnie uogólnimy na więcej niż dwa systemy.
Mówiąc dokładniej, niech będzie systemem, którego zbiorem stanów klasycznych jest a niech będzie drugim systemem, którego zbiorem stanów klasycznych jest Zauważ, że ponieważ nazwaliśmy te zbiory zbiorami stanów klasycznych, zakładamy, że i są oba skończone i niepuste. Może być, że ale nie musi tak być — a niezależnie od tego, pomocne będzie używanie różnych nazw w odniesieniu do tych zbiorów dla zachowania jasności.
Wyobraźmy sobie teraz, że oba systemy, i są umieszczone obok siebie, z po lewej stronie i po prawej. Jeśli zechcemy, możemy rozpatrywać te dwa systemy tak, jakby tworzyły pojedynczy system, który możemy oznaczyć przez lub zależnie od preferencji. Naturalne pytanie, jakie można zadać o ten złożony system brzmi: „Jakie są jego stany klasyczne?".
Odpowiedź brzmi: zbiór stanów klasycznych jest iloczynem kartezjańskim (Cartesian product) zbiorów i który jest zbiorem zdefiniowanym jako
Mówiąc prosto, iloczyn kartezjański (Cartesian product) jest dokładnie tym pojęciem matematycznym, które wyraża ideę postrzegania elementu jednego zbioru i elementu drugiego zbioru razem, tak jakby tworzyły pojedynczy element pojedynczego zbioru. W rozważanym przypadku stwierdzenie, że jest w stanie klasycznym oznacza, że jest w stanie klasycznym oraz jest w stanie klasycznym a jeśli stan klasyczny to i stan klasyczny to to stan klasyczny systemu wspólnego to
Dla więcej niż dwóch systemów sytuacja uogólnia się w naturalny sposób. Jeśli założymy, że są systemami mającymi odpowiednio zbiory stanów klasycznych to dla dowolnej dodatniej liczby całkowitej zbiór stanów klasycznych -ki traktowanej jako pojedynczy system wspólny, jest iloczynem kartezjańskim (Cartesian product)
Oczywiście możemy dowolnie nazywać systemy i porządkować je według własnego wyboru. W szczególności, jeśli mamy systemów jak powyżej, możemy zamiast tego nazwać je i ułożyć je od prawej do lewej, tak że system wspólny staje się Idąc za tym samym wzorcem w nazywaniu odpowiadających stanów klasycznych i zbiorów stanów klasycznych, moglibyśmy wtedy mówić o stanie klasycznym
tego systemu złożonego. Istotnie, jest to konwencja porządkowania używana przez Qiskit przy nazywaniu wielu kubitów. Do tej konwencji i jej związku z obwodami kwantowymi powrócimy w następnej lekcji, ale zaczniemy ją stosować już teraz, aby się do niej przyzwyczaić.
Często wygodnie jest zapisać stan klasyczny w postaci jako ciąg znaków dla zwięzłości, szczególnie w bardzo typowej sytuacji, gdy zbiory stanów klasycznych są związane ze zbiorami symboli lub znaków. W tym kontekście termin alfabet jest powszechnie używany w odniesieniu do zbiorów symboli używanych do tworzenia ciągów znaków, ale matematyczna definicja alfabetu jest dokładnie taka sama jak definicja zbioru stanów klasycznych: jest to zbiór skończony i niepusty.
Na przykład, przypuśćmy, że są bitami, tak że zbiory stanów klasycznych tych systemów są wszystkie takie same.
Istnieje wtedy stanów klasycznych systemu wspólnego które są elementami zbioru
Zapisane jako ciągi znaków, te stany klasyczne wyglądają następująco:
Dla stanu klasycznego na przykład, widzimy, że i są w stanie podczas gdy wszystkie inne systemy są w stanie
Stany probabilistyczne
Przypomnijmy z poprzedniej lekcji, że stan probabilistyczny przypisuje prawdopodobieństwo każdemu klasycznemu stanowi systemu. Zatem stan probabilistyczny wielu systemów — traktowanych zbiorczo jako jeden system — przypisuje prawdopodobieństwo każdemu elementowi iloczynu kartezjańskiego klasycznych zbiorów stanów poszczególnych systemów.
Załóżmy na przykład, że zarówno , jak i są bitami, tak że odpowiadające im klasyczne zbiory stanów to odpowiednio oraz Oto stan probabilistyczny pary
Jest to stan probabilistyczny, w którym zarówno , jak i są losowymi bitami — każdy z nich przyjmuje wartość z prawdopodobieństwem oraz z prawdopodobieństwem — ale klasyczne stany obu bitów zawsze się zgadzają. Jest to przykład korelacji między tymi systemami.
Porządkowanie zbiorów stanów iloczynu kartezjańskiego
Stany probabilistyczne systemów można reprezentować za pomocą wektorów prawdopodobieństwa, co zostało omówione w poprzedniej lekcji. W szczególności elementy wektora reprezentują prawdopodobieństwa tego, że system znajduje się w poszczególnych klasycznych stanach tego systemu, przy czym zakłada się, że została wybrana odpowiedniość między elementami wektora a zbiorem stanów klasycznych.
Wybór takiej odpowiedniości oznacza w istocie ustalenie porządku stanów klasycznych, który często jest naturalny lub określony przez standardową konwencję. Na przykład alfabet binarny jest naturalnie uporządkowany z na pierwszym miejscu i na drugim, więc pierwszy element w wektorze prawdopodobieństwa reprezentującym stan probabilistyczny bitu to prawdopodobieństwo tego, że jest on w stanie a drugi element to prawdopodobieństwo, że jest w stanie
Nic się w tym nie zmienia w kontekście wielu systemów, ale należy podjąć jedną decyzję. Klasyczny zbiór stanów wielu systemów razem, traktowanych zbiorczo jako jeden system, jest iloczynem kartezjańskim klasycznych zbiorów stanów poszczególnych systemów — musimy więc zdecydować, jak mają być uporządkowane elementy iloczynów kartezjańskich klasycznych zbiorów stanów.
Stosujemy w tym celu prostą konwencję, polegającą na rozpoczęciu od porządków już istniejących dla poszczególnych klasycznych zbiorów stanów, a następnie uporządkowaniu elementów iloczynu kartezjańskiego alfabetycznie. Innymi słowy, elementy każdej -tki (lub równoważnie symbole w każdym ciągu) są traktowane tak, jakby ich znaczenie malało od lewej do prawej. Na przykład, zgodnie z tą konwencją, iloczyn kartezjański jest uporządkowany następująco:
Gdy -tki są zapisywane jako ciągi i uporządkowane w ten sposób, obserwujemy znajome wzorce, takie jak uporządkowanie jako oraz zbioru uporządkowanego tak, jak zostało to zapisane wcześniej w lekcji. Jako inny przykład, traktując zbiór jako zbiór ciągów, otrzymujemy dwucyfrowe liczby od do uporządkowane numerycznie. Oczywiście nie jest to zbieg okoliczności; nasz system dziesiętny używa dokładnie tego rodzaju uporządkowania alfabetycznego, przy czym słowo alfabetyczne należy rozumieć w szerokim sensie, obejmującym oprócz liter także cyfry.
Wracając do powyższego przykładu dwóch bitów, wcześniej opisany stan probabilistyczny jest więc reprezentowany przez następujący wektor prawdopodobieństwa, w którym elementy zostały wyraźnie opisane dla jasności.
Niezależność dwóch systemów
Szczególnym rodzajem stanu probabilistycznego dwóch systemów jest taki, w którym systemy są niezależne. Intuicyjnie mówiąc, dwa systemy są niezależne, jeśli poznanie klasycznego stanu jednego z systemów nie ma wpływu na prawdopodobieństwa związane z drugim. Innymi słowy, poznanie klasycznego stanu jednego z systemów nie dostarcza żadnych informacji o klasycznym stanie drugiego.
Aby zdefiniować to pojęcie precyzyjnie, załóżmy ponownie, że i są systemami o klasycznych zbiorach stanów odpowiednio i Względem danego stanu probabilistycznego tych systemów mówi się, że są one niezależne, jeżeli zachodzi
dla każdego wyboru oraz
Aby wyrazić ten warunek w kategoriach wektorów prawdopodobieństwa, załóżmy, że dany stan probabilistyczny jest opisany wektorem prawdopodobieństwa, zapisanym w notacji Diraca jako
Warunek niezależności jest wtedy równoważny istnieniu dwóch wektorów prawdopodobieństwa
reprezentujących prawdopodobieństwa związane z klasycznymi stanami odpowiednio i takich że
dla wszystkich oraz
Na przykład stan probabilistyczny pary bitów reprezentowany przez wektor
jest takim stanem, w którym i są niezależne. Konkretnie, warunek wymagany dla niezależności jest spełniony dla wektorów prawdopodobieństwa
Na przykład, aby prawdopodobieństwa dla stanu były zgodne, potrzebujemy i rzeczywiście tak jest. Pozostałe elementy można zweryfikować w podobny sposób.
Z drugiej strony, stan probabilistyczny który możemy zapisać jako
nie reprezentuje niezależności między systemami i Oto prosty argument uzasadniający to stwierdzenie.
Załóżmy, że istniałyby wektory prawdopodobieństwa i jak w równaniu powyżej, dla których warunek byłby spełniony dla każdego wyboru i Musiałoby wtedy zachodzić
Oznacza to, że albo albo ponieważ gdyby oba były niezerowe, iloczyn również byłby niezerowy. Prowadzi to do wniosku, że albo (w przypadku ), albo (w przypadku ). Widzimy jednak, że żadna z tych równości nie może być prawdziwa, ponieważ musimy mieć oraz Stąd nie istnieją wektory i spełniające własność wymaganą dla niezależności.
Po zdefiniowaniu niezależności między dwoma systemami możemy teraz zdefiniować, co rozumiemy przez korelację: jest to brak niezależności. Na przykład, ponieważ dwa bity w stanie probabilistycznym reprezentowanym przez wektor nie są niezależne, są one z definicji skorelowane.
Iloczyny tensorowe wektorów
Właśnie opisany warunek niezależności można zwięźle wyrazić za pomocą pojęcia iloczynu tensorowego. Chociaż iloczyny tensorowe są pojęciem bardzo ogólnym i mogą być definiowane dość abstrakcyjnie oraz stosowane do różnorodnych struktur matematycznych, w omawianym przypadku możemy przyjąć prostą i konkretną definicję.
Dane są dwa wektory
iloczyn tensorowy jest wektorem zdefiniowanym jako
Wpisy tego nowego wektora odpowiadają elementom iloczynu kartezjańskiego które w poprzednim równaniu zapisane są jako ciągi znaków. Równoważnie, wektor jest zdefiniowany przez równanie
będące prawdziwe dla każdego oraz
Możemy teraz przeformułować warunek niezależności: dla układu złożonego w stanie probabilistycznym reprezentowanym przez wektor prawdopodobieństwa układy i są niezależne, jeśli otrzymujemy poprzez wzięcie iloczynu tensorowego
wektorów prawdopodobieństwa oraz na każdym z podukładów i W tej sytuacji mówimy, że jest stanem produktowym lub wektorem produktowym.
Często pomijamy symbol przy braniu iloczynu tensorowego ketów, pisząc na przykład zamiast Ta konwencja oddaje ideę, że iloczyn tensorowy jest w tym kontekście najbardziej naturalnym lub domyślnym sposobem brania iloczynu dwóch wektorów. Choć rzadziej spotykana, notacja jest również czasami używana.
Gdy stosujemy alfabetyczną konwencję porządkowania elementów iloczynów kartezjańskich, otrzymujemy następującą specyfikację iloczynu tensorowego dwóch wektorów kolumnowych.
Jako ważną uwagę na marginesie, zauważmy następujące wyrażenie dla iloczynów tensorowych standardowych wektorów bazowych:
Alternatywnie moglibyśmy zapisać jako parę uporządkowaną, a nie ciąg znaków, w którym to przypadku otrzymujemy Jednak częściej w tej sytuacji pomija się nawiasy, zamiast tego pisząc Jest to typowe w matematyce ogólnie; nawiasy, które nie dodają jasności ani nie usuwają wieloznaczności, są często po prostu pomijane.
Iloczyn tensorowy dwóch wektorów ma istotną właściwość, jaką jest biliniowość, co oznacza, że jest liniowy w każdym z dwóch argumentów z osobna, przy założeniu, że drugi argument jest ustalony. Właściwość tę można wyrazić poprzez następujące równania:
1. Liniowość w pierwszym argumencie:
2. Liniowość w drugim argumencie:
Rozważając drugie równanie w każdej z tych par równań, widzimy, że skalary "swobodnie unoszą się" wewnątrz iloczynów tensorowych:
Nie ma zatem żadnej wieloznaczności w pisaniu po prostu lub alternatywnie bądź na oznaczenie tego wektora.
Niezależność i iloczyny tensorowe dla trzech lub większej liczby układów
Pojęcia niezależności i iloczynów tensorowych uogólniają się bezpośrednio na trzy lub większą liczbę układów. Jeśli są układami mającymi klasyczne zbiory stanów odpowiednio to stan probabilistyczny układu złożonego jest stanem produktowym, jeśli powiązany wektor prawdopodobieństwa ma postać
dla wektorów prawdopodobieństwa opisujących stany probabilistyczne Tutaj definicja iloczynu tensorowego uogólnia się w naturalny sposób: wektor
jest zdefiniowany przez równanie
będące prawdziwe dla każdego
Innym, ale równoważnym, sposobem zdefiniowania iloczynu tensorowego trzech lub większej liczby wektorów jest definicja rekurencyjna w kategoriach iloczynów tensorowych dwóch wektorów:
Podobnie jak iloczyn tensorowy tylko dwóch wektorów, iloczyn tensorowy trzech lub większej liczby wektorów jest liniowy w każdym z argumentów z osobna, przy założeniu, że wszystkie pozostałe argumenty są ustalone. W takim przypadku mówimy, że iloczyn tensorowy trzech lub większej liczby wektorów jest wieloliniowy.
Podobnie jak w przypadku dwóch układów, moglibyśmy powiedzieć, że układy są niezależne, gdy znajdują się w stanie produktowym, ale termin wzajemnie niezależne jest bardziej precyzyjny. Istnieją również inne pojęcia niezależności dla trzech lub większej liczby układów, takie jak niezależność parami, które są zarówno interesujące, jak i ważne — ale nie w kontekście tego kursu.
Uogólniając wcześniejszą obserwację dotyczącą iloczynów tensorowych standardowych wektorów bazowych, dla dowolnej dodatniej liczby całkowitej i dowolnych stanów klasycznych mamy
Pomiary stanów probabilistycznych
Przejdźmy teraz do pomiarów stanów probabilistycznych wielu systemów. Wybierając sposób postrzegania wielu systemów łącznie jako pojedynczych systemów, natychmiast otrzymujemy specyfikację tego, jak muszą działać pomiary dla wielu systemów — pod warunkiem, że mierzone są wszystkie systemy.
Na przykład, jeśli stan probabilistyczny dwóch bitów jest opisany przez wektor prawdopodobieństwa
to wynik — co oznacza dla pomiaru oraz dla pomiaru — uzyskuje się z prawdopodobieństwem a wynik również uzyskuje się z prawdopodobieństwem W każdym przypadku odpowiednio aktualizujemy opis naszej wiedzy w postaci wektora prawdopodobieństwa, tak że stan probabilistyczny staje się odpowiednio lub
Moglibyśmy jednak zdecydować się na pomiar nie każdego systemu, lecz jedynie niektórych z nich. W rezultacie otrzymamy wynik pomiaru dla każdego mierzonego systemu, a to również (ogólnie) wpłynie na naszą wiedzę o pozostałych systemach, których nie zmierzyliśmy.
Aby wyjaśnić, jak to działa, skupimy się na przypadku dwóch systemów, z których jeden jest mierzony. Bardziej ogólna sytuacja — w której mierzony jest pewien właściwy podzbiór trzech lub więcej systemów — efektywnie redukuje się do przypadku dwóch systemów, gdy traktujemy systemy mierzone łącznie tak, jakby tworzyły jeden system, a systemy, które nie są mierzone, tak, jakby tworzyły drugi system.
Mówiąc dokładniej, załóżmy, że i są systemami, których klasyczne zbiory stanów to odpowiednio i oraz że oba systemy razem znajdują się w pewnym stanie probabilistycznym. Rozważymy, co się dzieje, gdy mierzymy tylko i nie robimy nic z Sytuacja, w której mierzony jest tylko a z nic się nie dzieje, jest obsługiwana symetrycznie.
Po pierwsze, wiemy, że prawdopodobieństwo zaobserwowania konkretnego stanu klasycznego podczas pomiaru tylko musi być spójne z prawdopodobieństwami, które uzyskalibyśmy przy założeniu, że również został zmierzony. Oznacza to, że musimy mieć
Jest to wzór na tak zwany zredukowany (lub brzegowy) stan probabilistyczny samego
Wzór ten ma doskonały sens na poziomie intuicyjnym w tym znaczeniu, że musiałoby się wydarzyć coś bardzo dziwnego, aby był błędny. Gdyby był błędny, oznaczałoby to, że pomiar mógłby w jakiś sposób wpływać na probability associated z różnymi wynikami pomiaru niezależnie od rzeczywistego wyniku pomiaru Gdyby znajdowało się w odległym miejscu, takim jak na przykład gdzieś w innej galaktyce, pozwoliłoby to na sygnalizację szybszą od światła — którą odrzucamy na podstawie naszego rozumienia fizyki. Inny sposób zrozumienia tego wynika z interpretacji prawdopodobieństwa jako odzwierciedlenia stopnia przekonania. Sam fakt, że ktoś inny może zdecydować się spojrzeć na nie może zmienić stanu klasycznego więc bez żadnych informacji o tym, co zobaczył lub czego nie zobaczył, przekonania dotyczące stanu nie powinny się w rezultacie zmienić.
Teraz, przy założeniu, że mierzone jest tylko a nie, może nadal istnieć niepewność co do stanu klasycznego Z tego powodu, zamiast aktualizować nasz opis stanu probabilistycznego do dla pewnego wyboru i musimy zaktualizować nasz opis tak, aby ta niepewność co do była właściwie odzwierciedlona.
Poniższy wzór na prawdopodobieństwo warunkowe odzwierciedla tę niepewność.
W tym miejscu wyrażenie oznacza prawdopodobieństwo, że pod warunkiem (lub przy założeniu, że) Mówiąc technicznie, to wyrażenie ma sens tylko wtedy, gdy jest niezerowe, ponieważ jeśli to dzielimy przez zero i otrzymujemy symbol nieoznaczony Nie stanowi to jednak problemu, ponieważ jeśli prawdopodobieństwo związane z wynosi zero, to nigdy nie uzyskamy jako wyniku pomiaru więc nie musimy się przejmować tą możliwością.
Aby wyrazić te wzory w kategoriach wektorów prawdopodobieństwa, rozważmy wektor prawdopodobieństwa opisujący wspólny stan probabilistyczny
Pomiar samego daje każdy możliwy wynik z prawdopodobieństwem
Wektor reprezentujący stan probabilistyczny samego jest zatem dany przez
Po uzyskaniu konkretnego wyniku pomiaru stan probabilistyczny jest aktualizowany zgodnie ze wzorem na prawdopodobieństwa warunkowe, tak że jest reprezentowany przez ten wektor prawdopodobieństwa:
W przypadku, gdy pomiar dał w wyniku stan klasyczny aktualizujemy zatem nasz opis stanu probabilistycznego układu wspólnego do
Jednym ze sposobów myślenia o tej definicji jest postrzeganie jej jako normalizacji wektora gdzie dzielimy przez sumę wpisów tego wektora, aby otrzymać wektor prawdopodobieństwa. Ta normalizacja efektywnie uwzględnia warunkowanie zdarzeniem polegającym na tym, że pomiar dał wynik
Jako konkretny przykład załóżmy, że klasyczny zbiór stanów to klasyczny zbiór stanów to a stan probabilistyczny wynosi
Naszym celem będzie określenie prawdopodobieństw dwóch możliwych wyników ( i ) oraz obliczenie wynikowego stanu probabilistycznego dla obu wyników, przy założeniu, że mierzony jest system
Korzystając z dwuliniowości iloczynu tensorowego, a konkretnie z faktu, że jest on liniowy względem drugiego argumentu, możemy przepisać wektor następująco:
Słowami, to, co zrobiliśmy, to wyodrębnienie poszczególnych standardowych wektorów bazowych dla pierwszego systemu (czyli tego, który jest mierzony), tensorując każdy z nich z kombinacją liniową standardowych wektorów bazowych dla drugiego systemu, którą uzyskujemy, wybierając te wpisy pierwotnego wektora, które są zgodne z odpowiadającym stanem klasycznym pierwszego systemu. Chwila zastanowienia ujawnia, że jest to zawsze możliwe, niezależnie od tego, od jakiego wektora zaczęliśmy.
Po wyrażeniu naszego wektora prawdopodobieństwa w ten sposób, efekty pomiaru pierwszego systemu stają się łatwe do przeanalizowania. Prawdopodobieństwa dwóch wyników można uzyskać, sumując prawdopodobieństwa w nawiasach.
Prawdopodobieństwa te sumują się do jedności, zgodnie z oczekiwaniami — ale jest to użyteczne sprawdzenie naszych obliczeń.
A teraz stan probabilistyczny warunkowany każdym możliwym wynikiem można wywnioskować, normalizując wektory w nawiasach. Oznacza to, że dzielimy te wektory przez odpowiednie prawdopodobieństwa, które właśnie obliczyliśmy, tak aby stały się wektorami prawdopodobieństwa.
Zatem, pod warunkiem, że wynosi stan probabilistyczny staje się
a pod warunkiem, że pomiar wynosi stan probabilistyczny staje się
Operacje na stanach probabilistycznych
Aby zakończyć tę dyskusję na temat informacji klasycznej dla wielu układów, rozważymy operacje na wielu układach znajdujących się w stanach probabilistycznych. Kierując się tą samą ideą co wcześniej, możemy traktować wiele układów łącznie jako pojedyncze, złożone układy, a następnie odwołać się do poprzedniej lekcji, aby zobaczyć, jak to działa.
Wracając do typowej konfiguracji, w której mamy dwa układy oraz rozważmy klasyczne operacje na układzie złożonym Na podstawie poprzedniej lekcji i powyższej dyskusji stwierdzamy, że każda taka operacja jest reprezentowana przez macierz stochastyczną, której wiersze i kolumny są indeksowane przez iloczyn kartezjański
Na przykład przypuśćmy, że i są bitami, i rozważmy operację o następującym opisie.
Jest to operacja deterministyczna znana jako operacja controlled-NOT, w której jest bitem sterującym (control), decydującym, czy operacja NOT ma zostać zastosowana do bitu docelowego (target) Oto macierzowa reprezentacja tej operacji:
Jej działanie na stany bazy standardowej jest następujące.
Gdybyśmy zamienili role i przyjmując, że jest bitem sterującym, a bitem docelowym, to macierzowa reprezentacja operacji przyjęłaby postać
a jej działanie na stany bazy standardowej wyglądałoby tak:
Innym przykładem jest operacja o następującym opisie:
Macierzowa reprezentacja tej operacji jest następująca:
Działanie tej operacji na wektory bazy standardowej jest następujące:
W tych przykładach po prostu traktujemy dwa układy łącznie jako pojedynczy układ i postępujemy tak jak w poprzedniej lekcji.
To samo można zrobić dla dowolnej liczby układów. Na przykład wyobraźmy sobie, że mamy trzy bity i zwiększamy te trzy bity modulo — co oznacza, że traktujemy te trzy bity jako kodujące w notacji binarnej liczbę między a dodajemy a następnie bierzemy resztę z dzielenia przez Jednym ze sposobów wyrażenia tej operacji jest:
Innym sposobem wyrażenia tego jest
przy założeniu, że uzgodniliśmy, iż liczby od do wewnątrz ketów odnoszą się do trzybitowych kodowań binarnych tych liczb. Trzecią opcją jest wyrażenie tej operacji jako macierzy.
Niezależne operacje
Przypuśćmy teraz, że mamy wiele układów i niezależnie wykonujemy różne operacje na tych układach z osobna.
Na przykład, przyjmując naszą zwykłą konfigurację dwóch układów i mających klasyczne zbiory stanów odpowiednio i przypuśćmy, że wykonujemy jedną operację na i zupełnie niezależnie drugą operację na Jak wiemy z poprzedniej lekcji, operacje te są reprezentowane przez macierze stochastic — a ściślej, powiedzmy, że operacja na jest reprezentowana przez macierz a operacja na jest reprezentowana przez macierz Zatem wiersze i kolumny mają indeksy odpowiadające elementom a analogicznie wiersze i kolumny odpowiadają elementom
Naturalne pytanie brzmi: jeżeli spojrzymy na i łącznie jako na pojedynczy, złożony układ to jaka macierz reprezentuje połączone działanie tych dwóch operacji na tym układzie złożonym? Aby odpowiedzieć na to pytanie, musimy najpierw wprowadzić iloczyny tensorowe macierzy, które są podobne do iloczynów tensorowych wektorów i definiowane są analogicznie.
Iloczyny tensorowe macierzy
Iloczyn tensorowy macierzy
oraz
to macierz
Równoważnie, iloczyn tensorowy i jest zdefiniowany przez równanie
które jest prawdziwe dla każdego wyboru oraz
Alternatywnym, lecz równoważnym sposobem opisu jest stwierdzenie, że jest to jedyna macierz spełniająca równanie
dla każdego możliwego wyboru wektorów oraz przy założeniu, że indeksy odpowiadają elementom a indeksy odpowiadają
Zgodnie z opisaną wcześniej konwencją porządkowania elementów iloczynów kartezjańskich, możemy również jawnie zapisać iloczyn tensorowy dwóch macierzy w następujący sposób:
Iloczyny tensorowe trzech lub więcej macierzy definiuje się analogicznie. Jeśli są macierzami, których indeksy odpowiadają klasycznym zbiorom stanów to iloczyn tensorowy jest zdefiniowany warunkiem, że
dla każdego wyboru stanów klasycznych Alternatywnie, iloczyny tensorowe trzech lub więcej macierzy można zdefiniować rekurencyjnie, poprzez iloczyny tensorowe dwóch macierzy, podobnie jak obserwowaliśmy to w przypadku wektorów.
O iloczynie tensorowym macierzy mówi się czasami, że jest multiplikatywny, ponieważ równanie
jest zawsze prawdziwe, dla dowolnego wyboru macierzy oraz pod warunkiem, że iloczyny mają sens.
Operacje niezależne (ciąg dalszy)
Możemy teraz odpowiedzieć na zadane wcześniej pytanie: jeśli jest operacją probabilistyczną na jest operacją probabilistyczną na a obie operacje są wykonywane niezależnie, to wynikowa operacja na systemie złożonym jest iloczynem tensorowym
Zatem zarówno dla stanów probabilistycznych, jak i dla operacji probabilistycznych iloczyny tensorowe reprezentują niezależność. Jeśli mamy dwa systemy i które niezależnie znajdują się w stanach probabilistycznych oraz to system złożony znajduje się w stanie probabilistycznym a jeśli zastosujemy operacje probabilistyczne i do tych dwóch systemów niezależnie, to wynikowe działanie na systemie złożonym jest opisane przez operację
Przyjrzyjmy się przykładowi, który przypomina operację probabilistyczną na pojedynczym bicie z poprzedniej lekcji: jeśli klasyczny stan bitu to pozostaje on bez zmian; a jeśli klasyczny stan bitu to to jest on zmieniany na 0 z prawdopodobieństwem Zaobserwowaliśmy, że ta operacja jest reprezentowana przez macierz
Jeśli ta operacja jest wykonywana na bicie a operacja NOT jest (niezależnie) wykonywana na drugim bicie to łączna operacja na systemie złożonym ma następującą reprezentację macierzową
Przez obserwację widzimy, że jest to macierz stochastic. Tak będzie zawsze: iloczyn tensorowy dwóch lub więcej macierzy stochastic jest zawsze stochastic.
Powszechną sytuacją, z którą się spotykamy, jest taka, w której jedna operacja jest wykonywana na jednym systemie, a z drugim nic się nie robi. W takim przypadku stosujemy dokładnie ten sam przepis, pamiętając, że nierobienie niczego jest reprezentowane przez macierz jednostkową. Na przykład, zresetowanie bitu do stanu i nierobienie niczego z daje operację probabilistyczną (a w rzeczywistości deterministyczną) na reprezentowaną przez macierz