Korelasyon analizi, iki değişken arasındaki ilişkinin gücünü ve yönünü belirlemek için kullanılan bir istatistiksel tekniktir Bu yöntem geniş bir yelpazede kullanılmaktadır, özellikle ekonomi, sosyoloji, psikoloji ve tıp gibi alanlarda yaygın olarak kullanılmaktadır Farklı korelasyon türleri arasında, Pearson korelasyonu, Spearman korelasyonu ve Kendall korelasyonu bulunmaktadır Pearson korelasyonu, doğrusal ilişkiyi ölçerken, Spearman ve Kendall korelasyonları non-parametrik verileri analiz etmek için kullanılır Bu yöntemler gerçek hayatta birçok alan için farklı uygulama örnekleri sunar Örneğin, bir kişinin kilosu ile ayakkabı numarası arasındaki ilişkiyi belirlemek için Pearson korelasyonu kullanılabilir En uygun korelasyon analizi yönteminin seçilmesi ve verilerin doğru şekilde toplanması, k
Korelasyon analizi, istatistiksel bir teknik olarak iki değişken arasındaki ilişkinin gücünü ve yönünü belirlemek için kullanılır. Birçok disiplinde geniş bir şekilde kullanılmaktadır, özellikle ekonomi, sosyoloji, psikoloji ve tıp gibi alanlarda yaygın olarak kullanılmaktadır. İki değişken arasındaki ilişkiyi belirlemek, bir değişkeni diğeri üzerinden tahmin etmek, bir değişkeni diğerindeki değişikliğe bağlamak veya iki değişken arasındaki nedensel ilişkiyi belirlemek için kullanılabilir. Bu makalede, Pearson korelasyonu, Spearman korelasyonu ve Kendall korelasyonu gibi farklı korelasyon türleri ele alınacak ve gerçek hayat uygulama örnekleri incelenecektir.
Korelasyon Analizi Nedir?
Korelasyon analizi, veri arasındaki ilişkiyi belirlemek için sıklıkla kullanılan bir yöntemdir. İki değişken arasındaki ilişkinin gücünü ve yönünü belirlemeye yardımcı olan bu yöntem, istatistiksel analizlerde yaygın olarak kullanılır.
Örneğin, bir araştırmacı, bir kişinin yaşına ve sigara içip içmediğine bakarak, sigara içmenin yaşla olan ilişkisini belirleyebilir. Bu şekilde korelasyon analizi, iki değişken arasındaki doğrusal ilişkiyi ölçerek, aralarındaki bağıntıyı inceler.
Korelasyon analizi, analiz edilen verilerin özelliklerine göre farklı türlerde yapılabilir. Pearson korelasyonu, iki değişken arasındaki doğrusal ilişkiyi ölçerken, Spearman ve Kendall korelasyonları, non-parametrik verileri analiz etmek için kullanılır. Bu şekilde, farklı veri türleri için uygun korelasyon analizi yöntemi seçilerek, daha doğru sonuçlara ulaşılabilir.
İki Değişken Arasındaki Farklı Korelasyon Türleri
Korelasyon analizi yaparken, farklı türleri de göz önünde bulundurmak önemlidir. Pearson korelasyonu, iki değişken arasındaki doğrusal ilişkiyi ölçmek için kullanılırken, Spearman ve Kendall korelasyonları, non-parametrik verileri analiz etmek için idealdir. Pearson korelasyonu için, değişkenler arasındaki doğrusal ilişkinin derecesini ve yönünü belirlemek için korelasyon katsayısı hesaplanır. Ancak, non-parametrik verilerde, verilerin sırası veya rütbesi göz önünde bulundurulmalıdır. Spearman korelasyonu, monotonik bir ilişkiyi ölçerken, Kendall korelasyonu ise sözde orana dayalı bir ilişkiyi ölçer. Bu yöntemler, veriler arasındaki bağımlılığın türüne bağlı olarak kullanılabilir.
Pearson Korelasyonu Uygulama Örneği
Pearson korelasyon katsayısı, iki değişken arasındaki lineer bir ilişkiyi ölçer ve bu ilişkinin gücü ve yönü hakkında bilgi verir. İlgili örnekte, bir kişinin kilosu ve sahip olduğu ayakkabı numarası arasındaki ilişki doğrusal değildir, ancak Pearson korelasyonu yine de kullanılabilir. Bunun için, veri seti kaydedilir ve Pearson korelasyon katsayısı hesaplanır. Hesaplama sonucunda, korelasyon katsayısı -0.12 olarak bulunur, bu da kilo ve ayakkabı numarası arasında negatif ama zayıf bir ilişki olduğunu gösterir.
Kilo | Ayakkabı Numarası |
---|---|
67 | 39 |
72 | 40 |
50 | 37 |
80 | 42 |
65 | 39 |
59 | 38 |
90 | 44 |
70 | 40 |
63 | 38 |
58 | 37 |
Bu hesaplama, bir araştırmacının verileri nasıl yorumlayabileceğini gösterir. Yine de, korelasyon analizi yapmadan önce, verilerin doğru şekilde toplandığından ve belirli bir korelasyon türünün kullanılmasının uygun olduğundan emin olunmalıdır.
Veri Seti:
Veri setimizde, kiloya göre sınıflandırılmış 100 kişi bulunmaktadır. Her bir kişinin ayakkabı numarası da veri setinde yer almaktadır. Bu veriler kullanılarak Pearson korelasyon katsayısı hesaplanabilir. Pearson korelasyonu, iki değişken arasındaki doğrusal ilişkiyi ölçmek için kullanılır ve bu veri setindeki kilo ve ayakkabı numarası arasındaki ilişkiyi belirlemek için kullanılabilir. Ayrıca, veri setimizde belli bir düzene göre sınıflandırılmış olduğu için bu verilerin kullanımı için parametrik testler tercih edilir.
- Her kişinin ayakkabı numarasıYukarıdaki örnekte kullanılan veri setinde, her kişinin kilosuna göre sınıflandırılmış 100 kişinin ayakkabı numarası verileri bulunmaktadır. Pearson korelasyon katsayısı, bu iki değişken arasındaki doğrusal ilişkiyi ölçmek için kullanılır. Ayakkabı numarası ve kilo arasında bir doğrusal ilişki olmadığı için, korelasyon katsayısı 0'a yakın bir değer verebilir. Bu veri setinde, farklı kategorilerdeki veriler arasındaki ilişkiyi belirlemek için farklı bir yöntem kullanmak daha uygun olabilir. Tablo ya da liste şeklinde verilerin daha anlaşılır olması sağlanabilir.
Pearson Korelasyonu:
Pearson korelasyonu, iki değişken arasındaki doğrusal ilişkiyi ölçmek için kullanılır. Pearson korelasyon katsayısı, -1 ile 1 arasında bir değere sahip olabilir. Birinci değişken arttıkça ve ikinci değişken azaldıkça, korelasyon katsayısı pozitif olacaktır. Buna karşılık, birinci değişken azaldıkça ve ikinci değişken arttıkça, korelasyon katsayısı negatif olacaktır. Korelasyon katsayısı 0'a yaklaştıkça, iki değişken arasındaki ilişki zayıf olacaktır.
Pearson korelasyonu uygulama örneğinde, bir kişinin kilosuyla sahip olduğu ayakkabı numarası arasındaki ilişkiyi belirlemek için kullanılmıştır. Kiloya göre sınıflandırılmış 100 kişi ve her kişinin ayakkabı numarası verileri verildiğinde, Pearson korelasyon katsayısı hesaplanarak iki değişken arasındaki ilişki belirlenebilir.
Kilo | Ayakkabı Numarası |
---|---|
60 | 38 |
70 | 39 |
80 | 41 |
90 | 42 |
70 | 38 |
85 | 40 |
75 | 39 |
82 | 40 |
68 | 37 |
73 | 38 |
Tablodan, kilo arttıkça genellikle ayakkabı numarasının da arttığı görülmektedir. Bu durumda, Pearson korelasyon katsayısı pozitif ve yaklaşık 0.72 olduğu bulunabilir.
Spearman ve Kendall Korelasyonları Uygulama Örneği
Bu örnekte, öğrencilerin sınıf notları ve ders çalışma saatleri non-parametrik verilerdir. Spearman korelasyonu, iki değişken arasındaki monotonik ilişkiyi ölçer, dolayısıyla sınıf notları ve ders çalışma saatleri arasındaki ilişkiyi ölçmek için this korelasyon kullanılabilir. Kendall korelasyonu ise, iki değişken arasındaki sözde orana dayalı bir ilişkiyi ölçer, ancak bu örnekte Spearman daha uygun bir seçenektir. Verilerin sıralamasına dayandığı için, sınıf notlarındaki yüksek sıralamalara sahip öğrencilerin, genellikle daha fazla ders çalıştığı anlaşılabilir.
Öğrenci | Sınıf Notu | Ders Çalışma Saati |
---|---|---|
1 | 70 | 5 |
2 | 80 | 6 |
3 | 85 | 7 |
4 | 90 | 8 |
5 | 60 | 4 |
6 | 75 | 6 |
Yukarıdaki veri setinde, 6 öğrencinin sınıf notları ve ders çalışma saatleri verilmiştir. Bu veriler kullanılarak, Spearman korelasyonu hesaplanabilir. Spearman korelasyon katsayısı -1 ve 1 arasında bir değer alabilir. 0'a yakın bir katsayı, iki değişken arasında bir ilişkinin olmadığını gösterirken, 1'e yakın bir katsayı, iki değişken arasında güçlü bir ilişki olduğunu gösterir. Örneğin, sınıf notu ile ders çalışma saatleri arasında yüksek bir korelasyon varsa, Spearman korelasyon katsayısı yaklaşık 1 olacaktır.
Örneğimizde, verileri sıraladıktan sonra, ders çalışma saatleri ile sınıf notları arasında güçlü bir ilişki olduğu görülmektedir. Spearman korelasyon katsayısı, 0.964 olarak bulunmuştur, bu da iki değişken arasında yüksek bir korelasyon olduğunu gösterir. Bu sonuçlar, öğrencilerin daha fazla ders çalışarak daha yüksek sınıf notları elde ettiğini doğrulamaktadır.
Veri Seti:
Sınıfta notu sıralamasına göre sınıflandırılmış 100 öğrenci kullanılabilir veri setidir. Veri setinde her öğrencinin sınıf notu ve ders çalışma saatleri kaydedilmiştir. Bu veriler, Spearman veya Kendall korelasyonları gibi non-parametrik korelasyon analiz yöntemleri için uygundur.
Aşağıdaki tablo, örnek veri setindeki ilk 10 öğrencinin sınıf notu ve ders çalışma saatlerini göstermektedir:
Öğrenci | Sınıf Notu | Ders Çalışma Saatleri |
---|---|---|
1 | 90 | 5 |
2 | 85 | 4 |
3 | 75 | 2.5 |
4 | 95 | 6 |
5 | 80 | 3.5 |
6 | 70 | 2 |
7 | 92 | 5.5 |
8 | 88 | 4.5 |
9 | 78 | 3 |
10 | 82 | 4 |
Bir araştırmacı, bir öğrencinin sınıf notu ile kaç saat ders çalıştığı arasındaki ilişkiyi belirlemek istiyor. Bu durumda, non-parametrik verileri analiz etmek için Spearman veya Kendall korelasyonları kullanılabilir. Veri setinde öğrenciler sınıfta notu sıralamasına göre sınıflandırılmıştır ve her öğrencinin ders çalışma saati kaydedilmiştir. Korelasyon analizi sonuçları, öğrencilerin daha çok ders çalıştıkça daha yüksek notlar aldığını göstermektedir. Bu sonuç, öğrencilerin başarısını artırmak için düzenli ve yeterli ders çalışma tavsiyesinde bulunan eğitimciler için önemlidir.
Spearman veya Kendall Korelasyonları:
Spearman veya Kendall Korelasyonları için, iki değişken arasındaki ilişkiyi belirlemek üzere sıralı veriler kullanılır. Spearman korelasyonu, söz konusu iki değişken arasındaki monotonik ilişkiyi incelerken, Kendall korelasyonu, iki değişken arasındaki sözde orana dayalı ilişkiyi ölçer. Bu nedenle, her iki korelasyon yöntemi de, ikili ilişkileri belirlemek için çok önemlidir ve araştırma hedeflerine ve veri tipine bağlı olarak seçilebilirler. Örneğin, kişisel satın alma alışkanlıkları ile maddi durum arasındaki ilişkinin incelenmesi durumunda, Spearman korelasyonu kullanılabilirken, online alışveriş verilerinde bir ürünün satış miktarı ve fiyatı arasındaki ilişkiyi belirlemek için Kendall korelasyonu kullanılabilir. Bununla birlikte, her iki yöntem de verilerin doğrusallığına bakmadan bir ilişkinin varlığını belirler.