Die wichtigsten formalen Grundlagen der Wahrscheinlichkeitstheorie sind nun gelegt. Darauf aufbauend definieren wir Zufallsvariablen. Zufallsvariablen sind - intuitiv gesprochen - Zahlen, deren Wert man noch nicht kennt, deren Wert sich aber (irgendwann) realisiert. Die formale Definition von Zufallsvariablen bezieht sich auf die Ergebnismenge.
Definition: Zufallsvariable
Eine Abbildung heißt Zufallsvariable (engl. random variable).
Eine Zufallsvariable kann man sich zwar als eine Zahl vorstellen, deren Wert man noch nicht kennt. Formal gesehen handelt es sich jedoch um eine Funktion, die jedem Element der Ergebnismenge genau eine reelle Zahl zuordnet.
Beispiel: Summe der Augenzahl
Als Beispiel betrachten wir ein Zufallsexperiment, bei dem zwei Würfel geworfen werden. Jeder der beiden Würfel zeigt dann 1, 2, 3, 4, 5 oder 6. Der Ergebnisraum hat folglich 36 Elemente, nämlich Nun definieren wir die Zufallsvariable : “Summe der Augenzahlen”. Offensichtlich kann es passieren, dass beide Würfel 1 zeigen, dann ist . Wenn einer der Würfel eine 1 anzeigt, der andere eine 2, dann ist usw. Die Abbildung bzw. Funktion aus dem Ergebnisraum in die Menge der reellen Zahlen sieht also so aus:
Wenn die Zufallsvariable sich realisiert, bezeichnet man die Realisation gewöhnlich mit einem Kleinbuchstaben. Beispielsweise ist die Realisation der Zufallsvariable . Allerdings werden Kleinbuchstaben auch in ihrer sonstigen Funktion als Variablennamen verwendet, man muss also auf den Kontext achten. Gedanklich ist es oft hilfreich, sich (also die Zufallsvariable) als die Situation ex ante und (also die Realisierung) als die Situation ex post vorzustellen.
Beachten Sie den großen Unterschied zwischen einer Zufallsvariable und ihrer Realisation. Die Zufallsvariable ist eine Funktion, die Realisation ist eine reelle Zahl. Wahrscheinlichkeitsaussagen lassen sich nur über Zufallsvariablen treffen, nicht über ihre Realisation.
Beispiel: Summe der Augenzahlen
Wir betrachten weiterhin das Zufallsexperiment mit zwei Würfeln. Wie hoch ist die Wahrscheinlichkeit, dass die Zufallsvariable : “Summe der beiden Augenzahlen” den Wert 4 annimmt? Um diese eigentlich sehr einfache Frage in dem formalen Rahmen sauber zu beantworten, müssen wir zunächst ermitteln, welche Ergebnisse aus dazu führen, dass ist (das sogenannte Urbild von ).
Es gibt drei Ergebnisse, die auf führen, nämlich und . Nun fragen wir uns, wie wahrscheinlich das Ereignis ist? Die Antwort ist einfach, weil es sich um ein Laplace-Experiment handelt,
Um mit Zufallsvorgängen in der Ökonomik zu arbeiten, sind Zufallsvariablen eine große Hilfe. Praktisch alle Vorgänge, bei denen der Zufall oder Unwissenheit eine Rolle spielen, lassen sich gut mit Hilfe von Zufallsvariablen beschreiben. In fast allen Fällen wird die Funktion nicht explizit angegeben, sondern implizit als vorhanden vorausgesetzt. Auch die Ergebnismenge wird im allgemeinen nicht ausdrücklich aufgeschrieben. Trotzdem ist es wichtig zu erkennen, dass Zufallsvariablen auf dem mengentheoretischen Fundament aufbauen, das wir in den vorangegangenen Kapiteln gelegt haben, und deshalb eine saubere mathematische Grundlage haben.
Beispiele: Ökonomische Zufallsvariablen
Mögliche Zufallsvariablen in der Ökonomik:
Die Zufallsvariable steht für die Rendite einer Aktiengesellschaft im kommenden Jahr. Wenn das Jahr vergangen ist, hat sich die Rendite realisiert. Von den ex ante vielen möglichen Renditen hat sich nur eine tatsächlich eingestellt.
bezeichnet den Erwerbsstatus einer zufällig aus einer Population ausgewählten Person. Der Erwerbsstatus wird durch eine Zahl kodiert: 0=nicht erwerbstätig, 1=Teilzeit, 2=Vollzeit. Sobald eine Person tatsächlich ausgewählt und befragt wurde, hat sich die Zufallsvariable realisiert und es ist dann entweder oder oder .
ist das Nettomonatseinkommen eines zufällig ausgewählten Haushalts einer Population. Nachdem ein Haushalt zufällig ausgewählt und befragt wurde, hat sich die Zufallsvariable realisiert und ist zum Beispiel .
ist die Dauer, die ein technisches Gerät ohne Fehler funktioniert. Beim ersten Start des Geräts weiß man noch nicht, wie lange es fehlerfrei laufen wird. Sobald ein Fehler auftritt, hat sich die Zufallsvariable realisiert. Die Realisation ist dann beispielsweise Stunden.
3.1 Verteilungsfunktion
Wir wissen zwar nicht, welchen Wert eine Zufallsvariable annehmen wird, aber oft wissen wir, dass bestimmte Werte mit einer höheren Wahrscheinlichkeit vorkommen als andere Werte. So wissen wir zum Beispiel, dass beim Werfen mit zwei Würfeln die Augensumme 2 weniger wahrscheinlich ist als die Augensumme 7, denn für die Augensumme 2 müssen beide Würfel eine 1 zeigen, für die Augensumme 7 gibt es dagegen viel mehr Möglichkeiten (nämlich 16, 25, 34, 43, 52 und 61). Um die Verteilung einer Zufallsvariable zu beschreiben, gibt es mehrere Möglichkeiten. Eine besonders wichtige ist die Verteilungsfunktion.
Definition: Verteilungsfunktion
Die Verteilungsfunktion (engl. cumulative distribution function, cdf) einer Zufallsvariable gibt für die Wahrscheinlichkeit an, dass ist, oder in Kursschreibweise Wenn die Zufallsvariable sich aus dem Kontext erschließt, schreibt man auch anstelle von einfach .
In der Definition wird die Verteilungsfunktion einer Zufallsvariable zurückgeführt auf Wahrscheinlichkeiten von Ereignissen. Dabei werden ganz spezielle Ereignisse betrachtet, nämlich . Es gibt also für jedes beliebige ein solches Ereignis. Für ein gegebenes enthält das Ereignis alle Ergebnisse, die dazu führen, dass die Zufallsvariable den Wert nicht überschreitet. Die kompliziertere Notation, in der das Ereignis ausdrücklich hingeschrieben wird, benutzt man in der Praxis sehr viel seltener als die Kurzschreibweise. Man sollte sie trotzdem kennen und vor allem verstehen, damit die enge Verbindung zwischen Zufallsvariablen und Ereignissen klar ist. Die Verteilungsfunktion einer Zufallsvariable ist sehr nützlich, weil durch sie die Verteilung der Zufallsvariable eindeutig charakterisiert wird. Kennt man die Verteilungsfunktion, dann weiß man alles über die Verteilung, was wichtig ist.
Die Verteilungsfunktion ist - wie der Name schon sagt - eine Funktion. Ihr Definitionsbereich ist die Menge der reellen Zahlen . Man darf also jede beliebige Zahl in die Funktion einsetzen. Der Wertebereich der Verteilungsfunktion ist das Intervall , da es sich um eine Wahrscheinlichkeit handelt. Verteilungsfunktionen sind (wegen ihrer Konstruktion) immer monoton wachsend. Sie verlaufen niemals fallend, es kann jedoch sein, dass sie in einigen Bereichen flach verlaufen und nicht steigen. Verteilungsfunktionen können stetig sein, sie können aber auch Sprünge aufweisen.
Wenn man die Verteilungsfunktion für immer kleinere Werte von auswertet, dann erreicht man (zumindest als Grenzwert) die 0, d.h. Für immer größere Werte von erreicht man (zumindest als Grenzwert) die 1, d.h. Für praktisch alle Anwendungen reicht es aus, sich auf zwei Klassen von Verteilungsfunktionen einzuschränken:
Die eine Klasse sind Treppenfunktionen (Stufenfunktionen), d.h. die Verteilungsfunktion hat Sprünge und verläuft zwischen den Sprüngen waagerecht. Zufallsvariablen, die eine solche Verteilungsfunktion haben, nennt man diskrete Zufallsvariablen.
Die andere Klasse sind stetige Verteilungsfunktionen (d.h. ohne Sprünge). Zufallsvariablen mit einer stetigen Verteilungsfunktion nennt man stetige Zufallsvariablen.
Im folgenden wird genauer definiert, wann Zufallsvariablen diskret oder stetig sind und was für Eigenschaften diskrete und stetige Zufallsvariablen haben.
3.2 Diskrete Zufallsvariablen
Definition: Diskrete Zufallsvariable
Eine Zufallsvariable heißt diskret (engl. discrete), wenn es
endliche viele Punkte oder
abzählbar unendlich viele Punkte
gibt mit der Eigenschaft für alle und
Ohne tiefer in die Mengenlehre einzusteigen, sei hier nur erwähnt, dass eine Menge abzählbar unendlich ist, wenn man ihre Elemente mit den natürlichen Zahlen durchnummerieren kann. Abzählbar unendlich sind zum Beispiel die Menge der natürlichen Zahlen , die Menge der ganzen Zahlen und die Menge aller Brüche , nicht jedoch die Menge der reellen Zahlen oder ein Intervall reeller Zahlen. Letztere nennt man überabzählbar unendlich.
Die Menge aller Werte, die eine diskret verteilte Zufallsvariable annehmen kann, nennt man den Träger (engl. support) der Verteilung. Für endliche viele Ausprägungen ist der Träger und für (abzählbar) unendlich viele Ausprägungen ist er Die Funktion heißt Wahrscheinlichkeitsfunktion. Gelegentlich finden Sie auch die Bezeichnung Dichte für die Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable. Den Subindex lässt man weg und schreibt , wenn aus dem Kontext hervorgeht, zu welcher Zufallsvariable die Wahrscheinlichkeitsfunktion gehört.
Die Verteilungsfunktion einer diskreten Zufallsvariable ist eine Treppenfunktion. Der Träger der Zufallsvariable gibt an, an welchen Stellen die Treppenstufen liegen. Die erste Stufe ist an der Stelle , die zweite an der Stelle etc. Die Stufenhöhen sind .
Die folgende Abbildung zeigt die Verteilungsfunktion einer Zufallsvariablen . Hier und bei den folgenden Abbildungen im Rest dieses eLehrbuchs können Sie den R-Code, mit dem die Grafiken erzeugt werden, aufklappen. Er wird jedoch nicht näher erklärt und ist zum Verständnis des Inhalts auch nicht notwendig.
An dieser Verteilungsfunktion lässt sich ablesen, dass
diskret verteilt ist, denn die Verteilungsfunktion ist eine Treppenfunktion,
den Wert mit einer Wahrscheinlichkeit von 0.3 annimmt, denn an der Stelle 0 springt die Verteilungsfunktion um 0.3 nach oben,
den Wert mit einer Wahrscheinlichkeit von 0.1 annimmt, denn an der Stelle 3 springt die Verteilungsfunktion um 0.1 nach oben,
den Wert mit einer Wahrscheinlichkeit von 0.2 annimmt
und den Wert mit einer Wahrscheinlichkeit von 0.4 annimmt.
Die schwarzen Punkte zeigen, dass der Funktionswert an einer Sprungstelle immer der obere Wert ist. Man nennt die Treppenfunktion rechts-stetig, denn wenn man von der Sprungstelle ein winziges Stück nach rechts wandert, ändert sich der Funktionswert nicht. Wandert man ein winziges Stück nach links, springt man auf die tiefere Stufe zurück.
Beispiel: Anzahl der Sechsen bei zwei Würfeln
Zwei Würfel werden geworfen. Die Zufallsvariable sei die Anzahl der Sechsen. Sie kann also nur die Wert 0, 1 oder 2 annehmen (Träger). Die Wahrscheinlichkeitsfunktion ist üüü Die zugehörige Verteilungsfunktion lautet üüüü bzw. als Grafik
R-Code zeigen
x <-c(0, 1, 2)y <-c(0, 25/36, 35/36, 1)plot(stepfun(x,y),verticals=FALSE, pch=19,xlab="x",ylab="F(x)",main="Verteilungsfunktion")
3.3 Stetige Zufallsvariablen
Definition: Stetige Zufallsvariable
Eine Zufallsvariable heißt stetig (engl. continuous), wenn es eine Funktion gibt, so dass für alle . Die Funktion heißt Dichtefunktion oder Dichte (engl. density function, density, probability density function, pdf).
Wenn aus dem Kontext hervorgeht, zu welcher Zufallsvariable eine Dichte gehört, lässt man den Subindex gewöhnlich weg und schreibt einfach . Die Dichte hat folgende Eigenschaften:
Die Dichte kann nicht negativ sein, da sonst die Verteilungsfunktion nicht mehr monoton wachsend wäre. Es gilt also für alle .
Die Fläche unter der Dichte muss 1 ergeben, da jede Verteilungsfunktion für gegen 1 konvergiert. Es gilt also
Die Dichte gibt an, wie steil die Verteilungsfunktion verläuft. Für alle Stellen, an denen die Verteilungsfunktion differenzierbar ist, gilt daher Es ist jedoch nicht unbedingt nötig, dass die Verteilungsfunktion überall differenzierbar ist, sie darf nicht differenzierbare Knicke enthalten. Wenn es nicht differenzierbare Stellen in der Verteilungsfunktion gibt, dann weist die Dichte an diesen Stellen einen Sprung auf.
Der Wert der Dichte an einer Stelle ist keine Wahrscheinlichkeit. Hingegen ist die Fläche unter der Dichte eine Wahrscheinlichkeit. So gilt beispielsweise
Die Wahrscheinlichkeit, dass eine stetige Zufallsvariable exakt den Wert annimmt, ist also (für jedes ) Das impliziert, dass es (im Gegensatz zu diskreten Zufallsvariablen) bei stetigen Zufallsvariablen keine Rolle spielt, ob in einer Ungleichung die Gleichheit enthalten ist oder nicht, d.h.
Die Menge ist der Träger (engl. support) der Zufallsvariable . Der Träger enthält alle Werte, die die Zufallsvariable im Prinzip annehmen könnte.
Obwohl die Dichte selbst keine Wahrscheinlichkeit ist, hilft sie beim intuitiven Verständnis einer Verteilung trotzdem sehr. Man erkennt an einem Dichte-Plot sofort, in in welchen Bereichen die Zufallsvariable mit großer Wahrscheinlichkeit liegen wird und wo es eher unwahrscheinlich ist.
Beispiel: Dichte- und Verteilungsfunktion
Die Dichte der Zufallsvariable sei Der Plot der Dichte zeigt, dass die Realisation der Zufallsvariable mit Sicherheit in dem Intervall liegen wird. Es ist eher unwahrscheinlich, dass ein Wert sehr nah an der rechten Grenzen realisiert wird. Auch der Bereich um die 0 herum ist etwas weniger wahrscheinlich als die Bereiche um die 0.75 herum oder nah an der linken Grenze.
Wie hoch ist die Wahrscheinlichkeit, dass die Zufallsvariable in dem Intervall liegt? Um diese Frage zu beantworten, berechnen wir das Integral
Die Verteilungsfunktion erhält man durch Integration der Dichte. Die Konstante (0.3275) muss so gewählt werden, dass die Verteilungsfunktion am Punkt -0.56 bei 0 startet und am Punkt 1.1 bei 1 endet. Der Plot der Verteilungsfunktion macht deutlich, dass Verteilungsfunktionen für das schnelle Erfassen der Eigenschaften einer Verteilung nicht so gut geeignet sind wie Dichtefunktionen. Die Realisation der Zufallsvariable liegt mit höherer Wahrscheinlichkeit in einem Bereich, in dem die Verteilungsfunktion steil ist, als in einem Bereich, in dem sie flacher verläuft. Bereiche, in denen die Verteilungsfunktion gar nicht ansteigt, gehören nicht zum Träger der Zufallsvariable.
Nicht immer ist es möglich, Integrale in geschlossener Form zu berechnen. In manchen Fällen ist es vielleicht möglich, aber so mühsam, dass sich der Aufwand nicht lohnt, wenn eine Approximation des Ergebnisses ausreicht. In solchen Fällen lassen sich die Integrale durch numerische Verfahren berechnen. Auch für die Plausibilitätskontrolle eines analytischen Ergebnisses eignet sich die numerische Integration. Die numerische Mathematik liefert ausgefeilte Algorithmen für die numerische Integration. In diesem Kurs lernen Sie nur eine “Holzhammer-Methode” kennen, mit der Sie eine grobe Approximation eines Integrals schnell und einfach bestimmen können.
Das Integral einer Funktion von bis ist die Fläche zwischen der Funktion und der x-Achse,
Die Fläche lässt sich annähern, indem man viele schmale Rechtecke in die Funktion einschmiegt. Die Graphik illustriert das beispielhaft für das Integral von 0.1 bis 0.8 der Dichtefunktion
Die Fläche der Rechtecke lässt sich sehr leicht bestimmen, selbst wenn es viele sind. Wenn die Gitterpunkte zwischen und mit bezeichnet werden und der Abstand zwischen zwei benachbarten Gitterpunkten mit , dann ist die gesamte Fläche aller Rechtecke Je feiner die Rechtecke (d.h. je größer bzw. je kleiner ) sind, desto genauer wird das Integral approximiert. Die Breite der Rechtecke entspricht (im Grenzwert) dem Symbol des Integrals.
Diese Berechnung kann wie folgt in R umgesetzt werden. Zuerst wird ein feines Gitter von bis erzeugt. Die Gitterpunkte werden in einem Vektor x abgelegt. Der Vektor wird durch die Funktion seq erzeugt (s. Kapitel A.1). Dabei können Sie entweder mit der Option length die Anzahl der Gitterpunkte festlegen oder alternativ mit der Option by den Abstand der Gitterpunkte voneinander vorgeben. In dem folgenden Code wird der Abstand vorgegeben und mit dx bezeichnet, um die Analogie zum Integral deutlich zu machen.
dx <-0.001x <-seq(from=0.1, to=0.8, by=dx)
Nun werden die Funktionwerte an allen Gitterpunkten x ermittelt und in dem Vektor f gespeichert. Da R vektor-orientiert arbeitet, geschieht das sehr einfach mit einem einzigen Befehl.
f <-0.5- x^4+ x^2
Der Wert des Integrals kann nun angenähert werden durch
sum(f*dx)
[1] 0.4554194
Der analytisch hergeleitete Wert des Integrals beträgt 0.4548. Der Fehler der numerischen Approximation ist also sehr klein.
3.5 Quantilfunktion
Die Quantilfunktion ist das Gegenstück zur Verteilungsfunktion. Während die Verteilungsfunktion auf die Frage antwortet “Wie hoch ist die Wahrscheinlichkeit, dass die Zufallsvariable den Wert nicht übersteigt?”, beantwortet die Quantilfunktion die Frage “Welcher Wert wird mit einer Wahrscheinlichkeit von nicht überschritten?”. Da es einige Fälle gibt, in denen diese Frage nicht eindeutig beantwortet werden kann, ist die formale Definition der Quantilfunktion etwas komplizierter:
Definition: Quantilfunktion
Die Funktion heißt Quantilfunktion von . Der Wert heißt p-Quantil von . Der Definitionsbereich ist (also ohne die Intervallgrenzen).
Den Subindex kann man weglassen, wenn sich die Zufallsvariable aus dem Kontext ergibt. Gelegentlich findet man auch die alternative Notation oder für die Quantilfunktion. Das 0.5-Quantil heißt auch Median (engl. median).
Aus einer gegebenen Verteilungsfunktion lässt sich die Quantilfunktion durch Invertieren finden. Das geht leicht, wenn die Verteilungsfunktion streng monoton steigend verläuft. Aufpassen muss man jedoch, wenn sie Sprünge aufweist oder in einigen Bereichen flach verläuft.
Beispiel: Anzahl der Sechsen bei zwei Würfeln
Zwei Würfel werden geworfen. Die Zufallsvariable sei die Anzahl der Sechsen. Die Verteilungsfunktion ist eine Treppenfunktion mit den Sprungstellen 0, 1 und 2, die hier noch einmal gezeigt wird.
R-Code zeigen
x <-c(0, 1, 2)y <-c(0, 25/36, 35/36, 1)plot(stepfun(x, y),verticals=FALSE, pch=19,xlab="x",ylab="F(x)",main="Verteilungsfunktion")
Wie sieht die zugehörige Quantilfunktion aus? Um das zu beantworten, wandern wir langsam die y-Achse hoch und schauen jeweils, welches Quantil zu dem Wert gehört. Für Werte von landet man auf dem Quantil 0. Für ergibt sich das Quantil 1 und für ist das Quantil 2. Also ist bzw. als Grafik
Im Gegensatz zur Verteilungsfunktion ist die Quantilfunktion nicht rechtsstetig, sondern linksstetig. Der Funktionswert an einer Sprungstelle ist gleich dem Grenzwert, wenn man sich von links der Sprungstelle nähert.
Beispiel: Quantilfunktion einer stetigen Zufallsvariable
Wir betrachten die Zufallsvariable mit der Verteilungsfunktion Zum Invertieren der Verteilungsfunktion reicht es aus, das Intervall zu betrachten, weil die Werte 0 und 1 nicht im Definitionsbereich der Quantilfunktion liegen. Zum Invertieren setzt man die Verteilungsfunktion auf den Wert und löst dann nach auf.
Folglich lautet die Quantilfunktion
3.6 Erwartungswert
Der Erwartungswert einer Verteilung gibt Auskunft darüber, wo der “Schwerpunkt” der Verteilung liegt.
Definition: Erwartungswert
Der Erwartungswert (engl. expectation) einer Zufallsvariable ist
Beachten Sie, dass der Erwartungswert einer Zufallsvariablen keine Zufallsvariable, sondern eine reelle Zahl ist. Wir werden später in Kapitel 7.1 sehen, dass der Erwartungswert derjenige Wert ist, gegen den der Durchschnitt von sehr vielen Realisierungen der Zufallsvariable (in einem gewissen Sinn) konvergiert. Wirft man z.B. einen Würfel sehr oft (eigentlich unendlich oft), dann ergibt sich als Durchschnitt der (unendlich) vielen Realisationen der Erwartungswert.
Wie der Erwartungswert einer Zufallsvariable berechnet wird, hängt davon ab, ob es sich um eine diskrete oder eine stetige Zufallsvariable handelt.
Beispiel: Erwartungswert einer diskreten Zufallsvariable
Zwei Würfel werden geworfen. Die Zufallsvariable sei die Anzahl der Sechsen. Wie hoch ist der Erwartungswert von ? Für die Berechnung benötigt man die Wahrscheinlichkeitsfunktion Der Erwartungswert ist
Beispiel: Erwartungswert einer stetigen Zufallsvariable
Die Dichte der stetigen Zufallsvariable sei Der Erwartungswert dieser Zufallsvariable beträgt
Der Erwartungswert einer stetige Zufallsvariable ist ein Integral. Es ist daher auch möglich, den Erwartungswert in R numerisch zu approximieren. Die Vorgehensweise ist analog zu Kapitel 3.4: Zuerst definiert man ein feines Gitter über dem relevanten Bereich. Für den Erwartungswert ist der relevante Bereich der gesamte Träger, also für das Intervall .
dx <-0.001x <-seq(-0.56, 1.1, by=dx)
Nun wird der Funktionswert an allen Gitterpunkten bestimmt.
f <--x^4+x^2+0.5
Die numerische Approximation des Erwartungswerts ist
sum(x*f*dx)
[1] 0.2753534
Die Abweichung vom analytisch hergeleiteten Wert ist sehr gering.
3.7 Varianz
Die Varianz einer Zufallsvariable gibt an, wie stark die Verteilung streut bzw. wie sehr man mit großen Abweichungen vom Erwartungswert rechnen sollte.
Definition: Varianz und Standardabweichung
Der Varianz (engl. variance) einer Zufallsvariable ist Die (positive) Wurzel aus der Varianz nennt man Standardabweichung (engl. standard deviation).
Ebenso wie der Erwartungswert ist auch die Varianz einer Zufallsvariable eine reelle Zahl. Für diskrete und stetige Zufallsvariablen lässt sich die Varianz folgendermaßen schreiben:
Für die Berechnung der Varianz ist manchmal die folgende Formel hilfreich:
Beispiel: Varianz einer diskreten Zufallsvariablen
Zwei Würfel werden geworfen. Die Zufallsvariable sei die Anzahl der Sechsen. Wie hoch ist die Varianz von ? Für die Berechnung nutzen wir den Streuungsverschiebungssatz. Der Erwartungswert von wird analog zum Erwartungswert berechnet. Es ergibt sich
Der Erwartungswert wurde bereits im vorherigen Abschnitt berechnet, nämlich . Die Varianz ist folglich
Beispiel: Varianz einer stetigen Zufallsvariablen
Auch für die Berechnung der Varianz einer stetigen Zufallsvariable nutzen wir den Streuungsverschiebungssatz. Die Dichte der stetigen Zufallsvariable sei Der Erwartungswert von beträgt
Der Erwartungswert von wurde bereits im letzten Abschnitt berechnet, und zwar . Damit ergibt sich die Varianz als
So wie der Erwartungswert kann auch die Varianz numerisch approximiert werden, denn auch die Varianz einer stetigen Zufallsvariable ist letztlich ein Integral. Wir nutzen wieder das Gitter
dx <-0.001x <-seq(-0.56, 1.1, by=dx)
und berechnen den Funktionswert an allen Gitterpunkten.
f <--x^4+ x^2+0.5
Die numerische Approximation der Varianz ist
sum((x-0.2754)^2* f * dx)
[1] 0.2277724
oder alternativ, wenn man den Verschiebungssatz anwendet,
sum(x^2* f * dx) -0.2754^2
[1] 0.2277794
Dabei wurde das Ergebnis für den Erwartungswert (gerundet 0.2754) übernommen. Die Abweichung vom analytisch hergeleiteten Wert ist wiederum gering, wenn auch etwas höher als beim Erwartungswert.
3.8 Lineare Transformationen
Eine lineare Transformation einer Zufallsvariable ergibt wieder eine Zufallsvariable. Für zwei reelle Zahlen und ist eine lineare Transformation von . Welche Eigenschaften hat die transformierte Zufallsvariable ? Wir sehen uns an, wie sich die Transformation auf die Verteilungsfunktion, den Erwartungswert und die Varianz auswirkt.
Die Verteilungsfunktion von ist für
Für dreht sich die Ungleichung bei der Division durch um, also gilt dann
Wie die Beziehung des letzten Terms zur Verteilungsfunktion von aussieht, lässt sich nicht einfach allgemein beantworten. Wenn stetig verteilt ist, macht es keinen Unterschied, ob in der Ungleichung ein “” oder ein “” steht, dann ist also Wie wirkt sich eine lineare Transformation auf den Erwartungswert aus? Wir untersuchen diskrete und stetige Zufallsvariablen getrennt voneinander. Zuerst betrachten wir eine diskrete Zufallsvariable und . Der Erwartungswert von ist
denn . Wenn eine stetige Zufallsvariable ist, dann gilt für den Erwartungswert der linearen Transformation
weil .
Es gilt also sowohl für diskrete als auch für stetige Zufallsvariablen, dass der Erwartungswert der linearen Transformation der Zufallsvariable der linearen Transformation des Erwartungswerts entspricht. Kurz gesagt, kann man den Erwartungswert in eine lineare Funktion “hineinziehen” oder ihn aus ihr “herausziehen”. Man sagt auch, dass der Erwartungswert ein “linearer Operator” ist.
Achtung: Den Erwartungswert darf man im allgemeinen nicht aus anderen (nichtlinearen) Funktionen herausziehen oder ihn dort hineinziehen. So ist beispielsweise im allgemeinen Die Ergebnisse zum Erwartungswert können wir nun benutzen, um die Varianz einer linear transformierten Zufallsvariable zu untersuchen. Es gilt
Diese Herleitung gilt sowohl für diskrete als auch für stetige Zufallsvariablen. Offensichtlich wirkt sich eine additive Verschiebung um überhaupt nicht auf die Varianz aus. Eine Multiplikation mit verändert die Varianz jedoch, und zwar um den Faktor . Wenn ist, wird die Varianz also größer, wenn ist, wird sie kleiner. Beachten Sie, dass es für die Varianz keine Rolle spielt, ob positiv oder negativ ist. Insbesondere bleibt die Varianz unverändert, wenn mit multipliziert wird.
3.9 Standardisierung
Eine lineare Transformation, die dazu führt, dass der Erwartungswert der transformierten Zufallsvariable 0 und die Varianz 1 ist, nennt man Standardisierung. Die transformierte Zufallsvariable heißt standardisiert. Vergleicht man zwei standardisierte Zufallsvariablen miteinander, dann wird sowohl die Lage (Erwartungswert) als auch die Streuung (Varianz) beim Vergleich ausgeblendet. Welche lineare Transformation muss für eine Standardisierung durchgeführt werden? Wie erreicht man, dass der Erwartungswert nach der Transformation 0 ist und die Varianz 1? Wir gehen in zwei Schritten vor. Im ersten Schritt subtrahieren wir von der Zufallsvariablen ihren Erwartungswert (also eine reelle Zahl), Die Zufallsvariable hat den Erwartungswert Die Varianz von ist gleich der Varianz von , denn die Varianz verändert sich nicht, wenn eine reelle Zahl addiert oder subtrahiert wird. Der Erwartungswert ist eine reelle Zahl. Man nennt die Zufallsvariable auch zentriert.
Im zweiten Schritt dividieren wir durch die Standardabweichung von , Dadurch verändert sich der Erwartungswert nicht, er bleibt weiterhin 0. Wie groß ist die Varianz? Um das zu beantworten, nutzen wir die Ergebisse zu Varianzen von linearen Transformationen, insb. das Ergebnis, dass eine multiplikative Konstante aus der Varianz herausgezogen werden kann, dann aber ins Quadrat gesetzt werden muss. Also ergibt sich Im letzten Schritt wird ausgenutzt, dass der Erwartungswert eine reelle Zahl ist, so dass nur eine Verschiebung der Zufallsvariable ist. Das hat keinen Einfluss auf die Varianz, sie ist weiterhin . Fassen wir zusammen: Wenn eine Zufallsvariable mit Erwartungswert und Varianz ist, dann hat die linear transformierte Zufallsvariable den Erwartungswert und die Varianz . In der Schreibweise des vorhergehenden Abschnitts erreicht man eine Standardisierung von durch die lineare Transformation mit und .