Korrelationskoeffizient

Der Korrelationskoeffizient ist ein Maß für den Grad des linearen Zusammenhangs zwischen zwei intervallskalierten Merkmalen. Er kann Werte zwischen -1 und +1 annehmen, wobei bei -1 ein perfekter negativer linearer Zusammenhang vorliegt und alle Punkte in einem Koordinatensystem auf einer fallenden Gerade liegen, während bei einem Wert von +1 ein perfekter positiver linearer Zusammenhang vorliegt und alle Punkte in einem Koordinatensystem auf einer steigenden Gerade liegen. Nimmt der Korrelationskoeffizient hingegen den Wert 0 an, dann besteht kein linearer Zusammenhang (Unkorreliertheit) zwischen den zwei betrachteten Merkmalen. Dennoch kann ein nichtlinearer Zusammenhang bestehen. Zu beachten ist auch, dass aus Unkorreliertheit nicht Unabhängigkeit folgt.

Der Korrelationskoeffizient berechnet sich für Zufallsvariablen, in dem man die Kovarianz Cov(X,Y) durch das Produkt der Standardabweichung von X und Y teilt:



Der empirische Korrelationskoeffizient berechnet sich folgendermaßen:



Abschließend ist zu sagen, dass mit dem Korrelationskoeffizient zwar ein linearer Zusammenhang nachgewiesen werden kann, allerdings werden keine kausale Beziehungen untersucht!