Görsel Veri Analizi İçin Matplotlib Kullanımı

Görsel Veri Analizi İçin Matplotlib Kullanımı

Görsel veri analizi yapmak isteyenler için matplotlib kullanımı hakkında bilgi sahibi olabilirsiniz Matplotlib sayesinde verilerinizi kolayca inceleyebilir ve analiz edebilirsiniz Detaylı bilgi için tıklayın

Görsel Veri Analizi İçin Matplotlib Kullanımı

Veri analizi ve görselleştirme, günümüzde işletmeler, araştırmacılar ve öğrenciler için önemli bir yere sahip. Görsel veri analizi, karmaşık veri setlerini daha anlamlı hale getirir. Bu amaçla, Python programlama dilinde kullanılabilen Matplotlib kütüphanesi sayesinde verileri görselleştirerek daha anlaşılır hale getirebilirsiniz.

Matplotlib, çizgi, bar, pasta gibi çeşitli grafikler çizmenizi sağlar. Bu grafikler, verileri gözlemlemek, anlamak ve karşılaştırmak için etkili araçlar sağlar. Ayrıca Matplotlib ile, grafik özelliklerini değiştirerek daha profesyonel grafikler oluşturabilirsiniz.

Matplotlib kütüphanesi, veri görselleştirme teknikleri konusunda sağladığı kolaylık sebebiyle, veri analizi ve görselleştirme alanında yaygın bir araçtır. Öğreneceğiniz yöntemlerle farklı grafik türleri oluşturup, verilerinizi daha anlaşılır ve göz alıcı hale getirebilirsiniz.


Plot Oluşturma

Matplotlib kütüphanesi, verileri görselleştirmek için birçok yöntem sağlar. Verilerinize uygun grafik tiplerini seçmek ve bu grafikleri oluşturmak için Matplotlib'ın sağladığı çeşitli araçları kullanabilirsiniz. Çizgi grafikleri, nokta grafikleri, bar grafikleri ve pasta grafikleri dahil olmak üzere birçok grafik türü Matplotlib ile oluşturulabilir.

Çizgi grafikleri, özellikle zaman serilerinin görselleştirilmesi için kullanışlıdır. Verilerinizin trendlerini ve değişimlerini analiz etmek için çizgi grafikleri oluşturabilirsiniz. Nokta grafikleri, özellikle kümeler halinde sunulan veriler için yararlıdır. Bar grafikleri, kategorik verilerin gösterimi için idealdir ve farklı boyutlarda veri kümeleri için oluşturulabilir. Pasta grafikleri, bir veri kümesinin yüzdelik oranlarını göstermek için kullanışlıdır.

Matplotlib'ın plot() fonksiyonu, verileri çizgi grafiği oluşturmak için kullanılabilir. Bu fonksiyon, birçok parametre alarak çizgi grafiği ayarlarını özelleştirmenizi sağlar. Ayrıca scatter() fonksiyonunu kullanarak nokta grafikleri oluşturabilir ve bar() fonksiyonunu kullanarak bar grafikleri oluşturabilirsiniz. Pie() fonksiyonu ise pasta grafikleri oluşturmak için kullanılır.

Çizgi Grafiği Parametreleri
Parametre Açıklama
x, y Çizgi grafiği oluşturmak için kullanılan veri serileri.
color Çizgi rengi.
linestyle Çizgi stilini belirler.
marker Nokta marker tipini belirler.
  • Cizgi grafiği oluşturma örneği:
import matplotlib.pyplot as pltimport numpy as npx = np.linspace(0, 10, 100)y = np.sin(x)plt.plot(x, y, color='blue', linestyle='-', marker='o')plt.title('Sine Wave')plt.xlabel('X')plt.ylabel('Y')plt.show()
  • Bar grafiği ve Pasta grafiği oluşturma örnekleri aşağıdaki gibidir:
import matplotlib.pyplot as pltimport numpy as npdata = {'a': 10, 'b': 20, 'c': 30, 'd': 40}plt.bar(data.keys(), data.values())plt.title('Bar Grafik')plt.xlabel('X')plt.ylabel('Y')plt.show()data = {'a': 10, 'b': 20, 'c': 30, 'd': 40}plt.pie(data.values(), labels=data.keys())plt.title('Pasta Grafik')plt.show()

Bu yöntemlerin yanı sıra, Matplotlib kütüphanesi daha özelleştirilmiş grafikler oluşturmanız için çeşitli araçlar sağlar. Örneğin, alt grafikler oluşturarak, birden fazla grafikleri tek bir grafik içinde birleştirebilirsiniz. Bu, farklı veri kümelerinin karşılaştırılmasına izin verir.


Grafik Özellikleri

Matplotlib kütüphanesi, grafiklerin özelliklerini özelleştirmek için birçok seçenek sunar. Grafiklerin renkleri değiştirilebilir ve eksenlerin ölçeklendirilmesi ayarlanabilir. Grafiklerin üstüne başlık ve etiketler eklenebilir ve katmanlar arasındaki farklılıkları gösterecek şekilde ayarlamalar yapılabilir.

Özellik Açıklama
Çizgi renkleri Çizgi rengi, çizgi stilini ve kalınlığını belirlemek için kullanılabilir.
Eksenlerin ölçeklendirilmesi Eksenlerin ölçeği özelleştirilebilir ve istenilen şekilde ayarlanabilir.
Başlık ve etiketler Grafiklerin üzerine başlık eklemek, eksenleri etiketlemek ve açıklama eklemek mümkündür.
Katmanlar arasındaki farklılıklar Grafiklerdeki veri serilerinin farklılıklarını göstermek için katmanlar arasında ayarlamalar yapılabilir.

Grafiklerin özellikleri belirlenirken dikkat edilmesi gereken bazı faktörler vardır. Örneğin, renkler seçilirken, renk körü kişilerin grafikleri anlaması için mavi ve turuncu gibi farklı renkler seçilmelidir. Eksenlerin ölçeği belirlenirken, grafikteki verilerin tamamı kapsanması ve verilerin net bir şekilde görülebilmesi sağlanmalıdır.


Çizgi Grafiği

Matplotlib kütüphanesiyle çizgi grafikleri oluşturmanın birçok yolu vardır. Bu grafikler verilerin zamana göre nasıl değiştiğini göstermek için kullanılır. Veri setindeki her bir değişken çizgi grafiklerinde bir veri serisi olarak adlandırılır.

Bir veri serisi oluşturmak için, x ve y eksenlerindeki verileri belirlemeniz gerekir. Örneğin, bir x ekseninde zamanı ve y ekseninde fiyatları göstermek isterseniz, x eksenindeki veri serisi zamana karşılık gelirken, y eksenindeki veri serisi fiyatlara karşılık gelir.

Ayrıca, çizgi grafikleri için stil ve renk seçenekleri de mevcuttur. Çizgi stilini değiştirebilir veya renk paletlerini değiştirebilirsiniz. Bu grafikler genellikle gözlemlerde bir trend veya desen arayarak analiz yapmak için kullanılır.

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

plt.plot(x, y)
plt.show()

Bu örnek kodda, x ve y eksenlerindeki veri serilerini belirledik ve plt.plot() komutuyla çizgi grafiğini oluşturduk. Grafik plt.show() komutuyla görüntülendi. Bu şekilde verilerinizi göstermek ve analiz yapmak için hızlı ve kolay bir yol olabilir.


Çoklu Çizgi Grafiği

Matplotlib kullanarak birden fazla veri serisini aynı grafikte göstermek, veriler arasındaki ilişkiyi ve farklılıkları görmek için oldukça önemlidir. Bu özellik, çoklu çizgi grafiği kullanılarak gerçekleştirilir. Çoklu çizgi grafiği, birden fazla çizgiyi aynı grafikte gösterme yeteneğine sahiptir. Bu yöntemle birden fazla veri seti arasındaki karşılaştırmalar yapılabilir ve aralarındaki farklılıklar kolayca görülebilir.

Çoklu çizgi grafiği oluşturmak için öncelikle her veri seti için verilerin x ve y eksenlerine yerleştirilmesi gerekir. Daha sonra, plot() fonksiyonunu kullanarak her veri setinin çizgi grafiğini oluşturabilirsiniz. Stil ve renk seçenekleri değiştirilerek her veri seti için farklı görseller elde edilebilir. Çoklu çizgi grafiği, birden fazla veri setini kolayca karşılaştırmak için kullanışlı bir araçtır.

X Ekseni Veri Seti 1 Veri Seti 2 Veri Seti 3
1 10 15 5
2 12 13 8
3 8 10 12
4 5 6 14

Aşağıdaki örnek, üç farklı veri setini aynı grafikte gösterir. Bu örnekte, çizgi renkleri, etiketleri ve özellikleri ayrıca belirlenmiştir.

import matplotlib.pyplot as pltx = [1, 2, 3, 4]y1 = [10, 12, 8, 5]y2 = [15, 13, 10, 6]y3 = [5, 8, 12, 14]plt.plot(x, y1, color='red', label='Veri Seti 1')plt.plot(x, y2, color='blue', label='Veri Seti 2')plt.plot(x, y3, color='green', label='Veri Seti 3')plt.title('Çoklu Çizgi Grafiği Örneği')plt.xlabel('X Ekseni')plt.ylabel('Y Ekseni')plt.legend()plt.show()

Yukarıdaki kod, üç farklı veri setini aynı grafikte gösteren bir çoklu çizgi grafiği oluşturur. Her veri setinin rengi ve etiketi belirlenmiştir. Grafik, etiketler ve başlıklar kullanılarak okunabilir hale getirilmiştir. Bu örnekle, birden fazla veri setini aynı grafikte gösterme yeteneği, Matplotlib kütüphanesi kullanarak veri görselleştirme yeteneklerini artıran başlıca bir özelliktir.


Alt Grafikler

Matplotlib kütüphanesi kullanılarak oluşturulan figürler içinde birden fazla grafik bulundurulabilir. Bu grafiklerin özellikleri figürün özellikleri ile birlikte belirlenir. Alt grafikler tek bir figürün içinde birden fazla grafik yerleştirme işlemi olarak düşünülebilir.

Alt grafikler, add_subplot() fonksiyonu kullanılarak oluşturulabilir. Bu fonksiyonla, oluşturulacak alt grafiklerin konumları ve sayısı belirlenebilir. Örneğin, tek bir figür içinde 2x2 şeklinde 4 adet alt grafik konumlandırmak için:

fig, axs = plt.subplots(nrows=2, ncols=2)

Bu kod ile birlikte 2x2, yani toplamda 4 adet alt grafik bulunan bir figür oluşturulur. nrows ve ncols parametreleri ile satır ve sütun sayıları belirlenir. Daha sonra, her bir alt grafik tek tek belirlenebilir. Örneğin:

axs[0, 0].plot(x, y)axs[0, 1].scatter(x, y)axs[1, 0].bar(x, y)axs[1, 1].pie(y)

Bu kod ile oluşturulan alt grafiklere aynı şekilde eksenler, etiketler, başlıklar ve diğer grafik özellikleri de eklenebilir. Alt grafikler oluşturmak, aynı figür içinde birden fazla grafik göstermek istediğinizde oldukça kullanışlı bir yöntemdir.


Bar Grafiği

Matplotlib, kategorik verilerin görselleştirilmesi için yatay ve dikey bar grafikleri oluşturma imkanı da sunar. Bu tür grafiklerde x ekseninde kategorik veriler, y ekseninde ise bir sayısal değer yer alır. Bar grafiği oluşturmak için aşağıdaki adımlar takip edilebilir:

  • Verilerin hazırlanması
  • Grafik türünün belirlenmesi (yatay veya dikey bar)
  • Grafik özelliklerinin belirlenmesi (renk, etiket, başlık vb.)

Örneğin, bar grafikleri kullanarak bir anket sonucunu göstermek istediğimizde kategorik verilerimiz anket sorusu seçenekleri olabilir. Verilerimizi hazırladıktan sonra plt.bar() fonksiyonunu kullanarak grafik oluşturabiliriz. Ayrıca plt.xticks() fonksiyonu ile x eksenindeki kategorik verilerin isimlerini ve plt.ylabel() fonksiyonu ile y ekseni etiketini ekleyebiliriz.

Aşağıdaki örnekte, bir işyerindeki departmanların çalışan sayıları gösterilmektedir:

Departman Çalışan Sayısı
Muhasebe 5
İK 8
Pazarlama 12
Teknik 10

Aşağıdaki kod satırları ile bu verileri bar grafiği olarak gösterebilirsiniz:

    departmanlar = ['Muhasebe', 'İK', 'Pazarlama', 'Teknik']    calisan_sayilari = [5, 8, 12, 10]        plt.bar(departmanlar, calisan_sayilari)    plt.xticks(departmanlar)    plt.ylabel('Çalışan Sayısı')    plt.title('Departmanlara Göre Çalışan Sayısı')        plt.show()

Bu kodlar ile yatay bir bar grafiği oluşturulur:

Bar Grafiği

Yığılmış Bar Grafiği

Yığılmış bar grafikleri, birden fazla veri serisini aynı grafikte göstermek için kullanışlı bir yöntemdir. Bu çeşit bar grafikleri, her bir kategorideki toplam değeri göstermenin yanı sıra, her veri serisinin katkısını gösterme imkanı sağlar. Bu teknik, ortaya çıkardığı etkileyici görsel sunum nedeniyle, dünya çapındaki önde gelen veri analistleri tarafından tercih edilir.

Yığılmış bar grafikleri, iki çeşit olarak oluşturulabilir: yatay ve dikey. Bu grafikler, birincil ve ikincil veri serilerini yığarak oluşturulur. Farklı renkler veya diğer görsel ipuçları kullanılarak, her veri serisi ayrı olarak işaretlenebilir. Bu şekilde, okuyucular kolayca hangi veri serisinin ne kadar katkı sağladığını ve hangi veri serisindeki toplamın ne kadar olduğunu anlayabilirler.

Kategori 1 Kategori 2 Kategori 3
Veri Serisi 1 20 25 15
Veri Serisi 2 35 20 30
Veri Serisi 3 15 10 25
  • Kategori 1, Kategori 2 ve Kategori 3, yatay eksendeki kategorileri temsil eder.
  • Veri Serisi 1, Veri Serisi 2 ve Veri Serisi 3, dikey eksendeki farklı veri serilerini temsil eder.
  • Yatay çubuklar, her bir kategori için toplam değeri gösterir.
  • Dikey çubuklar, her bir veri serisinin katkısını gösterir.

Matplotlib kullanarak yığılmış bar grafikleri oluşturmak oldukça basittir. İhtiyacınız olan tek şey, oluşturmak istediğiniz veri serilerinin bir listesi ve grafiği nasıl özelleştireceğinize dair bir fikir.

Özellikle satış verilerini analiz ederken, yığılmış bar grafikleri oldukça yararlıdır. İşletme sahipleri, satış yöneticileri ve tedarikçiler, yığılmış bar grafikleri kullanarak kategorik verileri daha kolay anlayabilir, trendleri daha kolay izleyebilir ve iyileştirme fırsatlarını daha erken tanıyabilirler.


Pie Chart

Pie chart, verilerin yüzdesel oranlarını göstermek için kullanılan bir görselleştirme tekniğidir. Bu grafik türü, veri kümesinin her bir bölümünün oranını açıkça görüntüler. Matplotlib kütüphanesi, pasta grafikleri oluşturmak için kullanabileceğiniz birçok fonksiyona sahiptir.

Pasta grafikleri, birkaç adımda oluşturulabilir. İlk olarak, grafik boyutu belirlenir. Daha sonra, "labels" ve "sizes" adında iki farklı veri dizisi tanımlanır. "Labels", her bir bölümün adını içerirken, "sizes" yüzdesel oranları içerir. Son olarak "plt.pie()" fonksiyonu çağrılarak grafik oluşturulur.

Bir pasta grafiğinin özellikleri de kolayca özelleştirilebilir. Grafik rengi, dilimler arasındaki boşluk, kenarlık rengi vb. gibi birçok özellik zaman içinde değiştirilebilir. Matplotlib, pasta grafiklerindeki her bir dilimi ayırt etmek için etiketler eklemenize de olanak tanır.

Fonksiyon Adı Açıklama
plt.pie(sizes, labels) Verilen "sizes" ve "labels" veri dizilerine dayalı pasta grafiği oluşturur.
plt.title() Çizilen grafiği başlıkla özelleştirir.
plt.legend() Grafiğe etiket ekler.

Bir pasta grafiği verileri açıkça gösterdiği için, işletmelerde ve araştırmalarda sık sık kullanılmaktadır. Ayrıca, pasta grafikleri, kategorik verilerin görselleştirilmesi için uzun süredir popüler bir seçenektir.


Uygulamalar

Matplotlib, görselleştirme yapmak istediğimiz verileri grafiğe dökmek için sıklıkla kullanılan bir Python kütüphanesidir. Bu yazıda, belirli örnekleri kullanarak veri görselleştirme tekniklerini anlatmaya çalıştık. Şimdi, Matplotlib kullanarak bazı uygulama örneklerine bir göz atalım.

Bir çizgi grafiğinde, veri noktaları doğruyla birleştirilerek bir veri setinin görselleştirilmesi sağlanır. Örneğin, yıl boyunca belirli bir şirketin hisse senetlerinin fiyat hareketlerini göstermek için bir çizgi grafiği oluşturabiliriz. Bu grafiğin x ekseni tarihi gösterirken, y ekseninde hisse senedi fiyatları yer alabilir. Aşağıda, bu tür bir çizgi grafiğinin basit bir örneği verilmiştir:

Tarih Fiyat
01/01/2021 100 TL
02/01/2021 110 TL
03/01/2021 120 TL
04/01/2021 105 TL
05/01/2021 95 TL

Bir bar grafiği, değişkenler arasındaki ilişkiyi göstermek için kullanılır. Bir bar grafiği, y ekseninde bir değişken değerini ve x ekseninde verilerin id'sini içerir. Örneğin, dünya ülkelerinin nüfus büyüklüklerini karşılaştırmak için bar grafikleri kullanabiliriz. Aşağıda, yatay bir bar grafiği örneği verilmiştir:

Ülke Nüfus
Amerika Birleşik Devletleri 328.2 Milyon
Brezilya 211.8 Milyon
İngiltere 67.9 Milyon
Fransa 65.3 Milyon
Almanya 83.1 Milyon

Bir pasta grafiği, bir veri kümesindeki yüzdesel oranları göstermek için kullanılır. Örneğin, bir şirketin karının nerede harcandığını göstermek için pasta grafikleri kullanabiliriz. Aşağıda, bir pasta grafiği örneği verilmiştir:

Kategori Yüzde
İşletme Giderleri 50%
Üretim Masrafları 30%
Personel Giderleri 20%

Bu uygulama örnekleri, Matplotlib'in kullanımının ne kadar yaygın olduğunu göstermektedir. Matplotlib, Python'daki en popüler grafik oluşturma kütüphanelerinden biridir ve birçok veri görselleştirme gereksinimine uygundur.