10 Korelasyon

Değişkenlerin birbiri ile olan ilişkilerini açıklamak çoğu araştırmacının ilgisini çekmiştir. İki değişkene ait çarpımlar toplamı (sum of cross products) \(S_{XY}=\sum(X-\bar X)(Y- \bar Y)\) iki değişken arasındaki ilişki hakkında sınırlı olsa da bilgi verebilir. Örneğin Şekil 10.1 X ve Y değişkeni arasındaki ilişkiyi gösterir ve çarpımlar toplamı sıfırdır.

##        x     y deviationX deviationY crossPRODUCT
## 1   1.00  0.00       0.93       0.00         0.00
## 2   0.90  0.43       0.83       0.43         0.36
## 3   0.62  0.78       0.56       0.78         0.44
## 4   0.22  0.97       0.16       0.97         0.15
## 5  -0.22  0.97      -0.29       0.97        -0.28
## 6  -0.62  0.78      -0.69       0.78        -0.54
## 7  -0.90  0.43      -0.97       0.43        -0.42
## 8  -1.00  0.00      -1.07       0.00         0.00
## 9  -0.90 -0.43      -0.97      -0.43         0.42
## 10 -0.62 -0.78      -0.69      -0.78         0.54
## 11 -0.22 -0.97      -0.29      -0.97         0.28
## 12  0.22 -0.97       0.16      -0.97        -0.15
## 13  0.62 -0.78       0.56      -0.78        -0.44
## 14  0.90 -0.43       0.83      -0.43        -0.36
## 15  1.00  0.00       0.93       0.00         0.00
Çarpimlar toplami=0

Figure 10.1: Çarpimlar toplami=0

İki değişken arasındaki kovaryans ise \(Cov_{XY}=S_{XY}/n-1\) ile hesaplanabilir. Fakat kovaryans ölçülen değişkenlerin skalasına bağımlıdır. Bir diğer ifade ile, değişkenlerin sayısal değerleri arttıkça kovaryans artar. Bu durum kovaryans yorumunu zorlaştırır. Bir korelasyon katsayısı ise genellikle -1 ve 1 arasındadır ve sınırları olduğu için yorumlaması daha kolaydır.

10.1 Pearson korelasyon katsayısı

Pearson 1986 yılında bir korelasyon katsayısı hesaplama yöntemi tanıtmıştır. Bu katsayı -1 ile +1 arasında değişir ve \(Cov_{XY}/S_X S_Y\) ile hesaplanabilir. Bu katsayı iki değişken arasındaki doğrusal ilişkiyi ölçer. Şekil 10.1 aralarındaki korelasyonun sıfır olduğu iki değişken ile çizilmiştir. Aslında şekil içerisindeki X ve Y bir biri ile ilişkisiz değillerdir çünkü şekil kabaca bir çemberdir. X ve Y beraber bir çember oluşturabilecek ilişkiye sahip oldukları halde , ilişki doğrusal olmadığından, aralarındaki korelasyon sıfırdır. Şekil 10.2 aralarında ilişki olan değişkenlere örnekler gösterir,(A) kusursuz pozitif korelasyon, +1, (B) 0.7 pozitif korelasyon, (C) 0 korelasyon, (D) -0.4 korelasyon ve (E) kusursuz negatif korelasyon,-1.

Correlation examples

Figure 10.2: Correlation examples

10.1.1 Pearson korelasyon katsayısının evren bazında yorumu

Örneklemden gelen bilgi (\(r\)) , evren (\(\rho\)) düzeyinde çıkarım yapmak zere kullanılabilir.

z transformasyonu . İkili normallik (bivariate normality) varsayımı ve en az 10 örneklem ile z transformasyonu kullanılarak evrene ait parametre hakkında yorum yapılabilir (Myers et al. (2013)). Transformasyon formülü \[z_r = \frac{1}{2}ln \left( \frac{1+r}{1-r} \right)\]

Standart hata \[\sigma_r = \frac{1}{\sqrt{n-3}}\] Güven aralığı \(z_r \pm z_{\alpha / 2} \sigma_r\). Korelasyon katsayısı yorumunu kolaylaştırması amacı ile ters transformasyon \(r=\frac{e^{2z_r}-1}{e^{2z_r}+1}\).

\(H_0:\rho=0\) boş hipotezi normal bir dağılımın uygun olduğu varsayımı ile sınanabilir; \[z=\frac{z_r - z_{\rho_{null}}}{\frac{1}{\sqrt{n-3}}}\]

t dağılımı da \(H_0:\rho=0\) boş hipotezini test etmek için kullanılabilir.

\[t=r\sqrt{\frac{n-2}{1-r^2}}\]

Bu istatistik \(n-2\) serbestlik derecesine sahip t dağılımını takip eder.

10.1.2 R betiği: Pearson korelasyon katsayısı

Gösterim amaçlı dataWBT (2.3) içerisinde yer alan Bayburt ilçesi seçilmiştir. TCA puanları ile kişi başı senelik gelir arasındaki korelasyon incelenmiştir.

# CSV yükle
urlfile='https://raw.githubusercontent.com/burakaydin/materyaller/gh-pages/ARPASS/dataWBT.csv'
dataWBT=read.csv(urlfile)

#URL sil
rm(urlfile)

#Bayburt ilini seç
#  sıralı silme uygula (listwise deletion)
dataWBT_Bayburt=dataWBT[dataWBT$city=="BAYBURT",]
#hist(dataWBT_Bayburt$income_per_member)

İkili normal dağılım @ref(fig:testbivarnorm zerinden incelenebilir. rgl (Adler and Murdoch (2017)) paketi ile oluşturulan bu grafik interaktiftir, fare ile inceleyiniz.

## wgl 
##   1