7  Kovarianz

Die Lage und die Streuung einer Zufallsvariable kann durch ihren Erwartungswert und ihre Varianz beschrieben werden. Wenn man zwei gemeinsam verteilte Zufallsvariablen hat, dann wird ihr Zusammenhang gewöhnlich durch die Kovarianz beschrieben.

7.1 Definition

Definition: Kovarianz

Die Kovarianz (engl. covariance) zweier gemeinsam verteilter Zufallsvariablen X und Y ist Cov(X,Y)=E[(XE(X))(YE(Y))]. Oft wird die Kovarianz auch als σX,Y notiert.

Die Kovarianz ist also letztlich ein Erwartungswert, und zwar der Erwartungswert eines Produkts. Die beiden Faktoren sind die beiden zentrierten Zufallsvariablen (XE(X)) und (YE(Y)). Wenn der Faktor (XE(X)) positiv ist, bedeutet das, dass X größer ist als sein Erwartungswert. Das Produkt ist immer dann positiv, wenn X größer (kleiner) als sein Erwartungswert ist und gleichzeitig auch Y größer (kleiner) als sein Erwartungswert ist. Mit anderen Worten: Wenn X und Y tendenziell gleichzeitig überdurchschnittlich groß oder klein sind, dann ist die Kovarianz positiv. Wenn hingegen ein großes X tendenziell mit einem kleinen Y einhergeht, dann ist die Kovarianz negativ. Vertauscht man X und Y in der Formel, ändert sich nichts, d.h. die Kovarianz ist symmetrisch.

Aus der Definition folgt sofort, dass die Kovarianz einer Zufallsvariable mit sich selbst die Varianz dieser Zufallsvariable ist, d.h. Cov(X,X)=Var(X).

Eine alternative Formel für die Kovarianz kann durch einfache Umformungen hergeleitet werden. Es gilt Cov(X,Y)=E(XY)E(X)E(Y).

Aus der Definition des Erwartungswerts ergibt sich, dass für gemeinsam diskrete Zufallsvariablen gilt Cov(X,Y)=j=1Jk=1K(xjμX)(ykμY)pjk, mit μX=E(X) und μY=E(Y). Für gemeinsam stetige Zufallsvariable gilt Cov(X,Y)=(xμX)(yμY)fX,Y(x,y)dydx.

Die Kovarianz spielt in den Wirtschaftswissenschaften immer dann eine sehr wichtige Rolle, wenn es um Risiko geht, also vor allem in den Bereichen Portfolio-Management, Risiko-Management, Banken und Versicherungen.

Bei linearen Transformationen von X und Y gilt Cov(aX+b,cY+d)=acCov(X,Y), d.h. die additiven Konstanten b und d fallen einfach weg, während die multiplikativen Konstanten vor die Kovarianz gezogen werden können. Bei der Herleitung dieser Formel werden die Rechenregeln für den Erwartungswert mehrmals angewendet (s. ):

Cov(aX+b,cY+d)=E[(aX+bE(aX+b))(cY+dE(cY+d))]=E[(aX+baE(X)b)(cY+dcE(Y)d)]=E[(aXaE(X))(cYcE(Y))]=E[a(XE(X))c(YE(Y))]=acE[(XE(X))(YE(Y))]=acCov(X,Y).

Wenn die beiden Zufallsvariablen unabhängig sind, dann ist Cov(X,Y)=0. Das lässt sich wie folgt nachweisen. Seien X und Y gemeinsam stetig und unabhängig verteilt (die Herleitung für gemeinsam diskrete Verteilungen verläuft analog). Für den Beweis nutzen wir die Beziehung Cov(X,Y)=E(XY)E(X)E(Y). Zuerst betrachten wir nur den Term E(XY). Für ihn gilt

E(XY)=xyfX,Y(x,y)dydx=xyfX(x)fY(y)dydx=xfX(x)yfY(y)dydx=xfX(x)dxyfY(y)dy=E(X)E(Y).

Folglich gilt für die Kovarianz unabhängiger X und Y, dass Cov(X,Y)=E(X)E(Y)E(X)E(Y)=0. Achtung: Umgekehrt folgt aus einer Kovarianz von 0 nicht unbedingt, dass X und Y unabhängig sind! Sie können durchaus abhängig sein und trotzdem eine Kovarianz von 0 aufweisen.

7.2 Summe zweier Zufallsvariablen

Die Kovarianz wird gebraucht, wenn man sich für die Verteilung von Summen von Zufallsvariablen interessiert. Wir beginnen mit dem einfachen Fall einer Summe von zwei Zufallsvariablen und verallgemeinern ihn anschließend Schritt für Schritt.

Seien X und Y gemeinsam stetig verteilte Zufallsvariablen (für gemeinsam diskret verteilte Zufallsvariable laufen die Herleitungen analog). Dann hat die Zufallsvariable Z=X+Y den Erwartungswert

E(Z)=(x+y)fX,Y(x,y)dydx=xfX,Y(x,y)+yfX,Y(x,y)dydx=xfX,Y(x,y)dydx+yfX,Y(x,y)dxdy=x[fX,Y(x,y)dy]dx+y[fX,Y(x,y)dx]dy=xfX(x)dx+yfY(y)dy=E(X)+E(Y).

Zur Erläuterung: Die Reihenfolge der Integration darf vertauscht werden. Das erfolgt beim Schritt von der zweiten zur dritten und vierten Zeile. Die Ausdrücke in den eckigen Klammern sind die Randverteilungen (s. ).

Die Herleitung zeigt, dass der Erwartungswert einer Summe von zwei Zufallsvariablen gleich der Summe ihrer Erwartungswerte ist. Dabei spielt es keine Rolle, ob die Zufallsvariable abhängig oder unabhängig voneinander sind.

Nun leiten wir die Varianz der Summe Z=X+Y her. Sie ist

Var(Z)=E[(ZE(Z))2]=E[(X+YE(X+Y))2]=E[(X+YE(X)E(Y))2]=E[((XE(X))+(YE(Y)))2]=E[(XE(X))2+(YE(Y))2+2(XE(X))(YE(Y))]=E[(XE(X))2]+E[(YE(Y))2]+2E[(XE(X))(YE(Y))]=Var(X)+Var(Y)+2Cov(X,Y).

Zur Erklärung: Der Schritt von der vierten zur fünften und sechsten Zeile ist eine Anwendung der ersten binomischen Formel. Im Schritt danach wird ausgenutzt, dass der Erwartungswert einer Summe die Summe der Erwartungswerte ist.

Die Varianz einer Summe von zwei Zufallsvariablen ist also im allgemeinen nicht die Summe ihrer Varianzen! Es gibt einen weiteren Term, nämlich die Kovarianz. Da die Kovarianz sowohl positiv als auch negativ sein kann, ist es möglich, dass die Varianz der Summe größer oder kleiner als die Summe der beiden Einzelvarianzen ist. Es kann sogar passieren, dass die Varianz der Summe kleiner als die kleinere der beiden Einzelvarianzen ist!

Wenn X und Y unabhängig sind, dann haben sie eine Kovarianz von Null. In diesem Fall gilt also, dass die Varianz der Summe die Summe der Varianzen ist, Var(X+Y)=Var(X)+Var(Y). Beachten Sie, dass so ein additiver Zusammenhang nicht für die Standardabweichung gilt.

Aus den Rechenregeln für Erwartungswert und Varianz von linearen Transformationen folgt (), dass

E(aX+bY)=aE(X)+bE(Y)Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y).

Diese Formeln haben eine wichtige ökonomische Bedeutung: Sie geben an, wie sich die Rendite eines Portfolios zu den Einzelrenditen verhält (wenn in dem Portfolio nur zwei Vermögensgegenstände enthalten sind).

Die Zufallsvariable X sei die Jahresrendite des Wertpapiers A, die Zufallsvariable Y sei die Jahresrendite des Wertpapiers B. Ein Investor möchte sein Vermögen (nur) in diesen beiden Assets anlegen. Er fragt seine Beraterin, wie hoch der Anteil des Vermögens sein soll, der in Wertpapier A angelegt wird, wenn das Risiko minimiert werden soll. Das Risiko wird gewöhnlich durch die Varianz (bzw. die Standardabweichung) gemessen. Die Beraterin kennt die folgenden Kennzahlen. Woher sie diese Informationen hat, sei an dieser Stelle dahingestellt; wer sich näher für die Schätzung von Finanzmarktgrößen interessiert, kann im Masterstudium das Modul Financial Econometrics belegen.

E(X)=0.02E(Y)=0.06Var(X)=0.01Var(Y)=0.04Cov(X,Y)=0.002

Die erwartete Rendite von Wertpapier A ist also niedriger als von B, sie beträgt nur 2 Prozent per annum (p.a.). Dafür ist Papier A jedoch auch weniger riskant als B, die Standardabweichung beträgt 0.1, wohin gegen Wertpapier B eine Standardabweichung von 0.2 hat, allerdings mit 6 Prozent p.a. auch einen höheren Erwartungswert bietet. Die Renditen der beiden Wertpapiere sind leicht gegenläufig, d.h. wenn die Rendite von Papier A hoch ist, dann ist die Rendite von Papier B tendenziell eher niedrig.

Wie hoch soll der Anteil des Vermögens sein, der in Papier A investiert wird, wenn das Ziel eine Minimierung des Gesamtrisikos ist? Sei a der Anteil, der in Papier A investiert wird. Dann ist 1a der in Papier B investierte Anteil. Die Gesamtrendite des Portfolios ist R=aX+(1a)Y. Die Portfoliorendite ist eine Zufallsvariable. Ihr Erwartungswert beträgt E(R)=aE(X)+(1a)E(Y)=a0.02+(1a)0.06. Das Risiko der Portfoliorendite, gemessen durch ihre Varianz, beträgt

Var(R)=a2Var(X)+(1a)2Var(Y)+2a(1a)Cov(X,Y)=a20.01+(1a)20.04+2a(1a)(0.002)

Fasst man die Terme geeignet zusammen, so ergibt sich Var(R)=0.054a20.084a+0.04. Diese Varianz hängt von Anteil a ab. Um sie zu minimieren, bildet man zunächst die Ableitung nach a. Sie lautet Var(R)a=0.108a0.084. Nullsetzen der Ableitung und Auflösen nach a ergibt den optimalen Anteil a=0.0840.1080.778. Das Risiko des Gesamtportfolios wird minimal, wenn 77.8 Prozent des Vermögens in Papier A und 22.2 Prozent in Papier B investiert werden. Dann gilt

E(R)=0.02888Var(R)=0.00733.

Es ist also möglich, eine Rendite zu erreichen, deren Erwartungswert höher ist als der kleinere Erwartungswert der beiden Einzelrenditen, und gleichzeitig eine Varianz, die niedriger ist als die kleinere der beiden Einzelvarianzen! Es wäre also unklug, sein ganzes Vermögen vollständig in dem sichereren Wertpapier A anzulegen. Durch eine geschickte Diversifikation auf beide Assets lässt sich das Risiko noch weiter verringern und trotzdem eine höhere erwartete Rendite erreichen!

7.3 Summe vieler Zufallsvariablen

Natürlich ist eine ernsthafte Portfolioanalyse nicht sinnvoll, wenn nur zwei Assets betrachtet werden können. Darum untersuchen wir nun, wie sich der Erwartungswert und die Varianz einer Summe von vielen Zufallsvariablen zu den einzelnen Erwartungswerten, Varianzen und Kovarianzen verhält.

Im allgemeinen Fall gibt es nicht nur zwei, sondern n Zufallsvariablen. Wir bezeichnen sie mit X1,,Xn. Sie haben eine gemeinsame Verteilung und sind im allgemeinen nicht unabhängig voneinander. Konkret nehmen wir an, dass sie gemeinsam stetig verteilt sind mit der gemeinsamen Dichtefunktion fX1,,Xn(x1,,xn).

Sei Z=X1++Xn. Dann gilt

E(Z)=E(X1++Xn)=E(X1)++E(Xn),

d.h. der Erwartungswert der Summe ist gerade die Summe der Erwartungswerte aller einzelnen Zufallsvariablen. Dabei spielt es keine Rolle, ob die Zufallsvariablen abhängig oder unabhängig voneinander sind.

Auf die ausführliche Herleitung wird an dieser Stelle verzichtet. Sie verläuft analog zum Fall zweier Zufallsvariablen, ist jedoch in der Notation komplexer. In dem Bachelor-Wahlpflichtmodul Advanced Statistics werden multivariate Zufallsvektoren ausführlicher behandelt.

Wie lässt sich die Varianz der Summe bestimmen? Dazu formen wir in der Definitionsgleichung der Varianz einige Terme um:

Var(Z)=E[(ZE(Z))2]=E[((X1++Xn)E(X1++Xn))2]=E[(X1++XnE(X1)E(Xn))2]=E[((X1E(X1))++(XnE(Xn)))2]=

Der Term in den eckigen Klammern ist das Quadrat einer Summe aus n Summanden. Beim Ausmultiplizieren muss jeder Summand mit jedem Summanden multipliziert werden, so dass man insgesamt n2 Summanden erhält. Hier leistet das Summenzeichen große Dienste, denn sonst wird die Notation sehr unübersichtlich.

=E[(i=1n(XiE(Xi)))2]=E[i=1nj=1n(XiE(Xi))(XjE(Xj))]=i=1nj=1nE[(XiE(Xi))(XjE(Xj))]=i=1nj=1nCov(Xi,Xj).

Die Varianz der Summe ist also die Summe aller paarweisen Kovarianzen. Berücksichtigt man, dass die Kovarianz einer Zufallsvariable mit sich selbst gerade die Varianz ist und dass die Kovarianz symmetrisch ist, so lässt sich der letzte Ausdruck auch wie folgt schreiben:

Var(i=1nXi)=i=1nj=1nCov(Xi,Xj)=i=1nVar(Xi)+2i=1n1j=i+1nCov(Xi,Xj)

Das die letzte Umformung korrekt ist, erkennt man am besten, wenn man alle Kovarianzen in einem quadratischen Tableau, der sogenannten Kovarianzmatrix, anordnet Cov(X1,X1)Cov(X1,X2)Cov(X1,X3)Cov(X1,Xn)Cov(X2,X1)Cov(X2,X2)Cov(X2,X3)Cov(X2,Xn)Cov(X3,X1)Cov(X3,X2)Cov(X3,X3)Cov(X3,Xn)Cov(Xn,X1)Cov(Xn,X2)Cov(Xn,X3)Cov(Xn,Xn) Die Doppelsumme i=1nj=1nCov(Xi,Xj) ergibt sich, indem man die Einträge in der Matrix zeilenweise addiert (zuerst alle Summanden in der ersten Zeile, dazu dann alle Summanden der zweiten Zeile etc.). Aber natürlich lässt sich die Summe aller Einträge auch anders finden, z.B. indem man zuerst alle Elemente der Diagonale addiert - das sind gerade die Varianzen. Anschließend addiert man alle Einträge der ersten oberen Nebendiagonale hinzu etc. Da alle Elemente oberhalb der Diagonale wegen der Symmetrie auch unterhalb der Diagonale vorkommen, verdoppelt man diese Einträge.

Wenn die Zufallsvariablen X1,,Xn unabhängig voneinander sind, dann vereinfacht sich die Formel für die Varianzen, weil alle Kovarianzen 0 sind. Übrig bleibt also im Fall der Unabhängigkeit nur Var(i=1nXi)=i=1nVar(Xi).

Zum Schluss verallgemeinern wir das allgemeine Ergebnis noch ein wenig weiter und betrachten eine Linearkombination von n Zufallsvariablen. Für reelle Zahlen a1,,an sei Z=i=1naiXi. Der Erwartungswert dieser gewichteten Summe beträgt E(Z)=i=1naiE(Xi). Der Erwartungswert einer gewichteten Summe von Zufallsvariablen entspricht also der gewichteten Summe der Erwartungswerte. Man sagt daher auch, dass der Erwartungswert ein linearer Operator ist.

Für die Varianz der gewichteten Summe gilt Var(Z)=i=1nai2Var(Xi)+2i=1n1j=i+1naiajCov(Xi,Xj). Diese Formel ist zentral für das Risikomanagement und die Portfolioplanung. Das wird an dem folgenden Beispiel deutlich.

Bei der Portfolioplanung lautet die bekannte Grundregel “Don’t put all your eggs in one basket”. Man sollte nicht “alles auf eine Karte setzen”. Das Risiko der Vermögensanlage lässt sich reduzieren, indem man Risikostreuung betreibt. Eine Diversifikation des Portfolios führt dazu, dass das Risiko der gesamten Portfoliorendite verringert werden kann. In einem großen Portfolio kann es sehr viele verschiedene Anlageformen geben, z.B. viele verschiedene Anleihen, Aktien, Optionen, Immobilien, Rohstoffe etc.

An einem einfachen Beispiel soll illustriert werden, wie aus den erwarteten Einzelrenditen, den Varianzen und den Kovarianzen der Erwartungswert und die Varianz der gesamten Portfoliorendite errechnet werden kann. In diesem Beispiel geht es nicht um eine Portfolio-Optimierung. Die Anteile, mit denen die Vermögensarten eingehen, sind fest vorgegeben. Die Methoden, die für eine Optimierung benötigt werden, können Sie in den Bachelor-Wahlpflichtmodulen Lineare Algebra und Advanced Statistics erlernen.

Das Vermögen wird auf fünf Assets (A, B, C, D, E) aufgeteilt. Die Jahresrenditen bezeichnen wir mit XA,,XE, die Portfoliorendite mit R. Die fünf Erwartungswerte der Jahresrenditen seien E(XA)=0.02E(XB)=0.06E(XC)=0.10E(XD)=0.05E(XE)=0.

Die fünf Varianzen seien

Var(XA)=0.01Var(XB)=0.06Var(XC)=0.12Var(XD)=0.02Var(XE)=0.10.

Die Kovarianzen lassen sich am übersichtlichsten in Form einer (symmetrischen) Matrix anordnen: XAXBXCXDXEXA0.0100.0120.0140.0030.009XB0.0120.0600.0340.0070.023XC0.0140.0340.1200.0100.033XD0.0030.0070.0100.0200.013XE0.0090.0230.0330.0130.100 Wie hoch sind Erwartungswert und Varianz der Portfoliorendite, wenn das Vermögen gleichmäßig auf die fünf Assets verteilt wird (also jeweils mit einem Anteil von 20 Prozent)?

Der Erwartungswert der Portfoliorendite beträgt

E(R)=0.20.02+0.20.06+0.20.10+0.20.05+0.20=0.046.

Die Varianz ist etwas mühevoller zu berechnen. Da die Gewichte alle gleich sind (nämlich 0.2), vereinfacht sich die Varianzformel zu Var(R)=0.22i{A,,E}j{A,,E}Cov(Xi,Xj).

Man addiert also alle Kovarianzen und multipliziert die Summe mit dem Quadrat des Gewichts. Das Resultat lautet

Var(R)=0.010+0.012+0.014+0.0030.009+0.012+0.023+0.014+0.033+0.003+0.0130.009+0.100=0.01256.

In diesem Portfolio ist das Risiko also etwas höher als die kleinste Varianz der Einzelrenditen. Dafür ist die erwartete Rendite aber auch mehr als doppelt so hoch wie die erwartete Rendite des Assets mit dem kleinsten Risiko (nämlich 4.6 Prozent im Vergleich zu nur 2 Prozent).

Zum Schluss holen wir mit den neu erworbenen Rechenregeln für Summen von Zufallsvariablen die Herleitungen von Erwartungswert und Varianz der Binomialverteilung nach, die wir in übersprungen haben. Zur Erinnerung: Eine Zufallsvariable X ist binomialverteilt, XB(n,π), wenn X=i=1n1Ai, wobei 1A1,,1An identisch und unabhängig Bernoulli-verteilte Zufallsvariablen sind. Für jedes 1Ai gilt

E(1Ai)=πVar(1Ai)=π(1π).

Daher gilt für den Erwartungswert von XB(n,π), E(X)=nπ. Wegen der Unabhängigkeit gilt für die Varianz Var(X)=nπ(1π).

7.4 Korrelationskoeffizient

Die Kovarianz hat viele Vorteile, aber auch einen großen Nachteil: Sie ist nicht normiert. Es ist also schwierig, den Wert der Kovarianz sinnvoll zu interpretieren. Es gibt jedoch eine normierte Version der Kovarianz, und zwar den Korrelationskoeffizienten.

Definition: Korrelationskoeffizient

Der Korrelationskoeffizient (engl. coefficient of correlation) der Zufallsvariablen X und Y ist Corr(X,Y)=Cov(X,Y)Var(X)Var(Y). Eine häufige alternative Notation für den Korrelationskoeffizienten ist ρX,Y.

Wie die Kovarianz ist auch der Korrelationskoeffizient symmetrisch, d.h. Corr(X,Y)=Corr(Y,X). Der Korrelationskoeffizient einer Zufallsvariable mit sich selbst nimmt immer den Wert 1 an, Corr(X,X)=1. Wenn X und Y unabhängig sind, gilt Corr(X,Y)=0. Wie schon bei der Kovarianz folgt jedoch aus der Unkorreliertheit nicht unbedingt die Unabhängigkeit. Die wichtigste Eigenschaft des Korrelationskoeffizienten ist jedoch, dass er normiert ist, 1Corr(X,Y)1. Wenn Corr(X,Y)=1 ist, dann existiert zwischen X und Y eine exakte, steigende lineare Beziehung, d.h. Y=aX+b mit a>0. Wenn der Wert 1 ist, gibt es auch eine exakte lineare Beziehung, aber sie ist dann mit a<0 fallend. Liegen die Werte betragsmäßig nahe an der 1 (z.B. 0.8), dann ist der lineare Zusammenhang etwas verrauscht. Je kleiner der Betrag des Korrelationskoeffizienten ist, desto stärker ist der lineare Zusammenhang durch Rauschen überlagert.