1.1 Probabilistische Bits

Wir benutzen Wahrscheinlichkeiten, wann immer eines von mehreren möglichen Ereignissen eintreten kann, wir aber noch nicht wissen, welches Ereignis tatsächlich eintreten wird – je wahrscheinlicher das Ereignis, desto höher dessen Wahrscheinlichkeit. Ein Ereignis welches auf jeden Fall eintritt, hat eine Wahrscheinlichkeit von 11 (also 100%), während ein Ereignis, das niemals eintritt, eine Wahrscheinlichkeit von 0 hat.

Wir können uns beispielsweise einen Münzwurf vorstellen. Wenn du eine Münze wirfst und sie, ohne sie anzuschauen, mit deiner Hand abdeckst, können zwei mögliche Ereignisse eintreten: entweder die “Kopf”-Seite zeigt nach oben, oder die “Zahl”-Seite zeigt nach oben. Bei einer fairen Münze sind beide Fälle gleich wahrscheinlich, also weisen wir beiden eine Wahrscheinlichkeit von 12=0.50\frac{1}{2}=0.50, also 50%50\%, zu (in Abb. 1.1 stellen wir diesen Fall als [Uncaptioned image] dar). Münzen können aber auch unfair (engl. biased) sein, also mit höherer Wahrscheinlichkeit auf einer der beiden Seiten landen. Je nachdem, wie unfair die Münze ist, man sich ein ganzes Spektrum an Möglichkeiten vorstellen: eine extrem unfaire Münze könnte immer mit der “Kopf”-Seite nach oben landen, eine andere dagegen vielleicht immer mit der “Zahl”-Seite (siehe [Uncaptioned image] und [Uncaptioned image] links und rechts in Abb. 1.1). Für die erste dieser beiden Münzen ist die Wahrscheinlichkeit des Ereignisses “Zahl” dabei 0 (da es immer mit der “Kopf”-Seite nach oben landet), während für die andere Münze das Ereignis “Zahl” die Wahrscheinlichkeit 11 hat.


Abbildung 1.1: Ein probabilistisches Bit, das den Zustand einer zufälligen Münze beschreibt. Die “Kopf”-Seite ist mit einem Eselskopf beschriftet und die “Zahl”-Seite mit einem Eselsschwanz. (Wieso das? Anstatt von “Kopf und Zahl” spricht man im Englischen von “heads or tails”…)

Da wir uns keine Gedanken über die genaue Konstruktion von Münzen von verschiedener Form und Größe machen wollen, ist es sinnvoll, die Information, die einen Münzwurf beschreibt, zu abstrahieren. Das erreichen wir, indem wir die Ereignisse “Kopf” und “Zahl” mit den Werten 0 und 11 eines Bits assoziieren. Dann lässt sich ein Münzwurf mit zwei Wahrscheinlichkeiten beschreiben: Der Wahrscheinlichkeit p0p_{0}, dass das Ergebnis 0 (“Kopf”) ist, und der Wahrscheinlichkeit p1p_{1}, dass das Ergebnis 11 (“Zahl”) ist. Ein solches Bit, welches seine beiden möglichen Werte mit bestimmten Wahrscheinlichkeiten annimmt, wird als probabilistisches Bit bezeichnet. Beachte dabei, dass sich die beiden Wahrscheinlichkeiten p0,p10p_{0},p_{1}\geq 0 notwendigerweise zu 11 aufaddieren müssen: p0+p1=1p_{0}+p_{1}=1. Wenn die Münze, wie im Beispiel oben, fair ist, dann muss, wie oben beschrieben, p0=p1=12p_{0}=p_{1}=\frac{1}{2} gelten.

Ist dir aufgefallen, dass es ausreichen würde, nur eine der beiden Wahrscheinlichkeiten p0p_{0} oder p1p_{1} anzugeben, da beide durch die jeweils andere bestimmt werden? Der Klarheit halber werden wir aber immer beide angeben und die Wahrscheinlichkeiten als Vektor schreiben:

p=(p0p1).p=\begin{pmatrix}p_{0}\\ p_{1}\end{pmatrix}. (1.1)

Wir nennen diesen Vektor die Wahrscheinlichkeitsverteilung oder den Zustand des probabilistischen Bits. Diese Vektornotation ist nicht nur praktisch, um alle Wahrscheinlichkeiten in einer schönen Tabelle darzustellen, sondern sie erlaubt es uns auch, ein probabilistisches Bit geometrich zu visualisieren. Außerdem wird es uns helfen, Parallelen zwischen probabilistischen Bits und Quantenbits zu sehen.

Wir nennen die beiden Zustände, bei denen das Ergebnis immer 0 (“Kopf”, [Uncaptioned image] ) oder immer 11 (“Zahl”, [Uncaptioned image] ) lautet, deterministisch. Dies entspricht den oben diskutierten “extrem unfairen” Münzen, bei denen das Ergebnis des Münzwurfs von vornherein eindeutig bestimmt ist. In Gl. 1.1 korrespondieren diese Zustände zu den Wahrscheinlichkeitsverteilungen mit p0=1p_{0}=1, p1=0p_{1}=0 bzw. p0=0p_{0}=0, p1=1p_{1}=1. Da wir diese Zustände häufig benutzen, ist es sinnvoll, folgende Abkürzung einzuführen:

[0]=(10),[1]=(01).\displaystyle[0]=\begin{pmatrix}1\\ 0\end{pmatrix},\qquad[1]=\begin{pmatrix}0\\ 1\end{pmatrix}. (1.6)

Diese Notation mag am Anfang ein wenig verwirren, aber du kannst dir [0][0] und [1][1] als  [Uncaptioned image] und  [Uncaptioned image] oder als [Kopf][\text{Kopf}] und [Zahl][\text{Zahl}] vorstellen, wenn du möchtest.

Diese zwei Zustände bilden eine Basis aller Zustände. Das bedeutet, das wir alle anderen Zustände als Linearkombination dieser beiden Zustände darstellen. Konkret:

(p0p1)=p0(10)+p1(01)=p0[0]+p1[1].\begin{pmatrix}p_{0}\\ p_{1}\end{pmatrix}=p_{0}\begin{pmatrix}1\\ 0\end{pmatrix}+p_{1}\begin{pmatrix}0\\ 1\end{pmatrix}=p_{0}[0]+p_{1}[1]. (1.7)

Da Zustände Vektoren sind, können wir sie in einem zweidimensionalen Koordinatensystem visualisieren. Die möglichen Zustände eines probabilistischen Bits entsprechen dann genau der Strecke zwischen den beiden Punkten [0][0] und [1][1], die den deterministischen Zuständen des Bits entsprechen (siehe Abb. 1.2).

Abbildung 1.2: Die blaue Strecke entspricht den Zuständen eines probabilistischen Bits.

Übungsaufgabe 1.1 (Die blaue Strecke verstehen).

Laut Abb. 1.2 bilden die möglichen Zustände eines probabilistischen Bits eine Strecke. Nimm dir etwas Zeit, um darüber nachzudenken, und versuche, folgende Fragen zu beantworten:

  1. 1.

    Warum liegen alle möglichen Zustände auf einer Strecke?

  2. 2.

    Warum hört die Strecke an den Koordinatenachsen auf und geht nicht weiter?

  3. 3.

    Welcher Punkt auf der Strecke entspricht einer fairen Münze?

Lösung.
  1. 1.

    Da immer eines der Ereignisse eintritt, muss die Summer der Wahrscheinlichkeiten notwendigerweise sich auf 1 addieren. Das bedeutet, dass p0+p1=1p_{0}+p_{1}=1 gilt. Durch umformen erhält man p1=1p0p_{1}=1-p_{0}, was einer Geradengleichung mit Steigung 1-1 entspricht.

  2. 2.

    Wenn die Strecke über die Koordinatenachsen hinaus gehen würde, müsste eine der Wahrscheinlichkeiten negativ werden. Da Wahrscheinlichkeiten aber nicht negativ sein können, müssen die Bedingungen p00p_{0}\geq 0 und p10p_{1}\geq 0 gelten, also die Strecke an den Koordinatenachsen enden.

  3. 3.

    Das ist der Mittelpunkt, an dem p0=p1=12p_{0}=p_{1}=\frac{1}{2} gilt.