Python'da Numpy ve Pandas Kullanımı

Python'da Numpy ve Pandas Kullanımı

Python'da Numpy ve Pandas kullanarak veri analizi yapmak artık daha kolay Bu rehberimizde, Numpy ve Pandas kütüphanelerinin temellerini öğrenin ve veri analizinde nasıl kullanabileceğinizi keşfedin Hemen okuyun!

Python'da Numpy ve Pandas Kullanımı

Pythonprogramlama dili, verilerin işlenmesi ve analizi için hızlı bir şekilde popüler hale gelmiştir. Bu konuda, Numpy ve Pandas gibi iki önemli kütüphaneler özellikle yoğun ilgi görmektedir. Bu makalede, Python dilinde veri işleme alanındaki en önemli iki kütüphane olan Numpy ve Pandas'ın kullanımı incelenecektir.

Numpy, bilimsel hesaplama işlemleri için oluşturulmuş bir Python kütüphanesidir. Numpy, finans, fizik, matematik ve diğer bilimsel alanlarda sıklıkla kullanılmaktadır. Özellikle verilerin matematiksel ve istatistiksel analizi için kullanılan Numpy'yı kullanarak, büyük ve karmaşık matris işlemleri hızlı ve kolay bir şekilde yapılabilir.

Pandas, veri manipülasyonu ve veri analizi için oluşturulmuş bir Python kütüphanesidir. Pandas, Dataframe adı verilen veri tablolarını kullanarak verileri kolayca işleyebilir. Bu kütüphane, SQL veritabanlarından veri okuma, filtreleme, birleştirme, SQL benzeri sorgular gibi işlemler yapmak için sıklıkla kullanılır.

Bu makalede, Numpy ve Pandas kütüphanelerinin kullanımı ayrıntılı olarak ele alınacaktır. Bu kütüphaneler hakkında daha fazla bilgi edinerek veri işleme becerilerinizi geliştirebilirsiniz.


Numpy Kullanımı

Python'da veri işleme için sıklıkla kullanılan Numpy kütüphanesi, özellikle bilimsel hesaplama işlemleri için oldukça kullanışlıdır. Numpy, çok boyutlu diziler ve matrisler oluşturmak, bu yapılar üzerinde çeşitli işlemler yapmak gibi birçok işlemi kolaylaştırmaktadır. Bu nedenle, çok sayıda veri işlemi uygulamasında Numpy kullanımı tercih edilmektedir.

Numpy, yüksek performans gerektiren veri işleme uygulamalarında verimli sonuçlar sunar. Pek çok Python kütüphanesi de Numpy'ı temel olarak kullanmaktadır. Bu nedenle, Numpy kütüphanesinin kurulumu ve temel işlemlerin öğrenilmesi, veri işleme çalışmaları için oldukça önemlidir.

  • Numpy dizileri oluşturma,
  • Numpy dizileri özellikleri belirleme,
  • Numpy dizilerinde indeksleme yöntemleri kullanma,
  • Numpy dizileri üzerinde matematiksel işlemler yapma,

Gibi konuların öğrenilmesi, Numpy kütüphanesinin temel işlemlerini anlamak açısından önemlidir. Bu işlemleri öğrendikten sonra Numpy kütüphanesiyle daha kompleks işlemler yapmak mümkün olacaktır.


Numpy Dizileri Oluşturma

Numpy kütüphanesi, Python dilinde bilimsel hesaplama ve veri işleme işlemlerinde sıkça kullanılan bir kütüphanedir. Bu kütüphanenin en temel öğesi olan diziler, farklı boyutlarda ve tiplerde oluşturulabilir. Numpy ile dizi oluşturma işlemlerinin nasıl yapılacağına dair örnekler aşağıda sunulmuştur.

Dizi Oluşturma Örnekleri:

  • 1D Dizi Oluşturma: Numpy ile 1 boyutlu bir dizi oluşturmak için aşağıdaki örnek kod kullanılabilir:
    arr1 = np.array([1, 2, 3, 4, 5])  
    Bu kod, [1, 2, 3, 4, 5] elemanlarından oluşan bir dizi oluşturacaktır.
  • 2D Dizi Oluşturma: 2 boyutlu bir dizi oluşturmak için aşağıdaki örnek kod kullanılabilir:
    arr2 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])  
    Bu kod, 1'den 9'a kadar olan sayılarla 3x3'lük bir matris oluşturacaktır.
  • Sıfır Dizi Oluşturma: Belirli bir boyutta sıfırlardan oluşan bir dizi oluşturmak için aşağıdaki örnek kod kullanılabilir:
    arr_zero = np.zeros((2, 3))  
    Bu kod, 2 satır ve 3 sütundan oluşan bir dizi oluşturacak ve tüm elemanları sıfır olarak ayarlayacaktır.
  • Rastgele Dizi Oluşturma: Belirli bir aralıkta rastgele sayılardan oluşan bir dizi oluşturmak için aşağıdaki örnek kod kullanılabilir:
    arr_rand = np.random.randint(0, 10, size=(3, 3))  
    Bu kod, 0 ile 10 arasında rastgele sayılarla dolu 3x3'lük bir matris oluşturacaktır.

Yukarıdaki örnekler, Numpy kütüphanesi ile farklı boyutlarda ve tiplerde dizilerin nasıl oluşturulacağına dair bir fikir verecektir. Bu diziler üzerinde işlemler yapmak için daha fazla Numpy özelliği ve yöntemi de mevcuttur.


Numpy Dizi Özellikleri

Numpy Dizi Özellikleri

Numpy, bilimsel hesaplama işlemleri için kullanılan bir Python kütüphanesidir. Numpy dizileri, belirli boyutlarda ve şekillerde çok boyutlu diziler oluşturulabilir. Ayrıca, Numpy dizilerinin tipi de belirlenebilir. Bu bölümde, Numpy dizilerinin özelliklerine ilişkin kullanılan kodlar incelenecektir.

Bir Numpy dizisinin özellikleri, shape, dtype, size ve ndim gibi özelliklerdir. Özelliklerin kullanımı aşağıdaki şekildedir:

Kod Açıklama
array.shape Numpy dizisinin boyutunu ve şeklini döndürür.
array.dtype Numpy dizisinin veri tipini döndürür.
array.size Numpy dizisinin eleman sayısını döndürür.
array.ndim Numpy dizisinin boyut sayısını döndürür.

Örneğin, aşağıdaki kod parçası bir Numpy dizisinin boyutlarını, veri tipini, eleman sayısını ve boyut sayısını belirlemek için kullanılır:

import numpy as nparr = np.array([[1, 2, 3], [4, 5, 6]])print("Dizi Şekli: ", arr.shape)print("Dizi Veri Tipi: ", arr.dtype)print("Dizi Eleman Sayısı: ", arr.size)print("Dizi Boyut Sayısı: ", arr.ndim)

Sonuç olarak, yukarıdaki kod parçası aşağıdaki gibi bir çıktı verir:

Dizi Şekli: (2, 3)Dizi Veri Tipi: int64Dizi Eleman Sayısı: 6Dizi Boyut Sayısı: 2

Yukarıdaki örnekte, shape özelliği, 2 satır ve 3 sütuna sahip bir dizi olduğunu gösterir. dtype özelliği, dizinin veri tipini gösterir, bu örnekte int64. size özelliği, dizideki toplam eleman sayısını gösterir, bu örnekte 6. Son olarak, ndim özelliği, dizinin boyut sayısını gösterir, bu örnekte 2'dir.


Numpy Dizi İndexleme

Numpy dizilerinde, belirli öğeleri seçmek için indeksleme yöntemleri kullanılır. İndeksler sıfırdan başlar ve parantez içinde yazılır. Birden fazla boyutta olan dizilerde de indeksleme yöntemleri kullanılır.

Bir boyutlu bir dizide, belirli bir öğeye erişmek için indeks numarasını belirtmek yeterlidir. Örneğin, dizi adı "arr" olan bir dizi için:

arr = np.array([1, 2, 3, 4])print(arr[2])

Bu kodda, "arr[2]" ifadesi 3. öğeyi seçer ve bunu ekrana yazdırır.

Bir dizinin belirli bir bölümüne erişmek için indeks aralığı kullanılır. Örneğin:

print(arr[1:3])

Bu kodda, "arr[1:3]" ifadesi 1. indeksten başlayarak 3. indekse kadar olan öğeleri alır ve bunları ekrana yazdırır.

Çok boyutlu dizilerde, öğelere erişmek için birden fazla indeks kullanılır. Örneğin, "arr" adlı iki boyutlu bir dizi için:

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])print(arr[1][2])

Bu kodda, "arr[1][2]" ifadesi ikinci satırın üçüncü öğesini seçer ve bunu ekrana yazdırır.

Belirli bir aralıktaki öğeleri seçmek için virgülle ayrılmış indeksler kullanılabilir:

print(arr[0:2, 1:3])

Bu kodda, "arr[0:2, 1:3]" ifadesi ilk iki satırın ikinci ve üçüncü öğelerini seçer ve bunları ekrana yazdırır.

Bir dizinin öğelerini ters çevirmek için ise, ":" şeklinde kullanılır:

print(arr[::-1, ::-1])

Bu kodda, "arr[::-1, ::-1]" ifadesi tüm dizinin öğelerini ters çevirir ve bunları ekrana yazdırır.


Numpy Dizi İşlemleri

Numpy kütüphanesi ile oluşturulan diziler üzerinde matematiksel işlemler yapmak oldukça kolaydır. Basit matris işlemleri için kullanılan toplama ve çarpma işlemleri aşağıdaki örneklerde verilmiştir:

İşlem Örnek Kod Örnek Çıktı
Toplama import numpy as np
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
c = a + b
print(c)
[5 7 9]
Çarpma import numpy as np
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
c = a * b
print(c)
[4 10 18]

Ayrıca, Numpy dizileri üzerinde transpoz seçimi de yapılabilir. Transpoz seçimi için '.T' kullanılır. Örnek kod aşağıdaki gibidir:

import numpy as npa = np.array([[1, 2], [3, 4]])b = a.Tprint(b)

Bu işlemin çıktısı şu şekilde olacaktır:

[[1 3] [2 4]]

Bu işlemler ile bilimsel hesaplamalarda sıklıkla kullanılan matris işlemleri kolaylıkla yapılabilir. Ayrıca, Numpy kütüphanesi ile dikdörtgen veya kare olmayan matrisler oluşturmak da mümkündür.


Pandas Kullanımı

Pandas, veri analizlerinde sıklıkla kullanılan bir Python kütüphanesidir. Hem büyük veri setleri hem de küçük veri setleri üzerinde hızlı ve etkili veri işleme yapmak için kullanılır. Pandas, iki ana nesne olan Seriler ve Veri Çerçeveleri aracılığıyla verileri yönetebilir.

Pandas ile veri okuma işlemleri oldukça kolaydır ve farklı veri kaynaklarından (csv, excel, sql) veri okumak mümkündür. Veri filtreleme ve seçme işlemleri, çok çeşitli yöntemler kullanılarak yapılabilir. Bunların arasında sorgu, sıralama, filtreleme ve gruplama yer alır. Pandas ile veri birleştirme işlemleri yapmak da kolaydır. Veri birleştirme, kaynak verilerinin anahtarlara göre birleştirilmesi işlemidir.

Pandas kütüphanesinde çok çeşitli fonksiyonlar bulunur. Bu fonksiyonlar, veri manipülasyonu ve veri analizi için kullanılır. Özellikle big data ile çalışırken, Pandas'ın yüksek performans özellikleri ve kolay kullanımı çok önemlidir.


Pandas Veri Okuma

Pandas kütüphanesi, veri analizi ve işleme için oldukça kullanışlı bir araçtır. Bu kütüphane ile farklı veri kaynaklarından (csv, excel, sql) veri okumak mümkündür.

Örneğin, verilerimiz bir csv dosyasında yer alıyorsa, verileri okumak için pd.read_csv() kodu kullanılabilir. Aynı şekilde, verilerimiz bir excel dosyasında yer alıyorsa pd.read_excel() kodu kullanılabilir. Bu yöntemlerin yanı sıra, SQL veri tabanlarından veri okuma işlemi için de kullanabileceğimiz bir yöntem mevcuttur: pd.read_sql()

Verilerimizi okuduktan sonra, bu veriler üzerinde işlemler yapabiliriz. Örneğin, gelen verilerin sadece bir kısmını kullanmak istiyorsak, bunun için head() fonksiyonundan yararlanabiliriz. Bu fonksiyon, veri setinin sadece ilk n satırını alır.

Verilerimizi okuduğumuzda, bazen bu verileri filtrelemek isteyebiliriz. Bu durumda, verileri filtrelemek için loc[] ve iloc[] kullanabiliriz. Bu fonksiyonlar, belirli bir kriteri karşılayan verileri seçmemize olanak sağlar.

Verilerimizi farklı kaynaklardan okurken, bazen veriler arasında tekrarlayan veriler olabilir. Bu durumda, drop_duplicates() fonksiyonundan yararlanabiliriz. Bu fonksiyon, veriler arasındaki tekrarlayan değerleri siler.

Veri okuma işlemleri, Pandas kütüphanesi ile oldukça basit ve hızlı bir şekilde gerçekleştirilebilir. Gelen verilerin işlemesinden arındırılması için, veri okuma işlemi sırasında çeşitli filtreleme işlemleri yapılabilir.


Pandas Veri Filtreleme

Pandas kütüphanesi, veri setleri üzerinde filtreleme işlemleri yapmak için oldukça kullanışlıdır. Bu sayede, büyük veri setlerinden istediğimiz verileri kolayca filtreleyebiliriz. Pandas kütüphanesinde, veri setleri üzerinde farklı filtreleme yöntemleri bulunmaktadır. Bu yöntemlerden bazıları şunlardır:

  • loc: label based indexing
  • iloc: integer based indexing
  • isin: verinin içinde belirli değerlerin olup olmadığını kontrol etmek için kullanılır
  • query: veri setinde SQL benzeri koşullar kullanarak sorgulama yapmak için kullanılır
  • where: veri setinde belirli koşullara uygun olan değerleri seçmek için kullanılır

Veri setleri üzerinde filtreleme işlemleri yaparken, her zaman doğru ve istediğimiz sonuçları almak için dikkatli olmalıyız. Aynı zamanda, filtreleme işlemlerini gerçekleştirmek için doğru yöntemleri seçmek de oldukça önemlidir.


Pandas Veri Gruplama ve Birleştirme

Pandas kütüphanesi ile veri gruplama ve birleştirme işlemleri oldukça kolaydır. Verileri gruplamak, işlemek ve analiz etmek için groupby fonksiyonu kullanılır. Bu fonksiyon, belirli bir sütuna göre verileri gruplar ve gruplar üzerinde işlemler yapmanıza olanak tanır.

Örneğin, bir şirketin çalışanlarına ait maaş verileri içeren bir veri setiniz var. Bu verileri departmanlara göre gruplamak için aşağıdaki kodu kullanabilirsiniz:

DepartmanMaaş
0Finans5000
1Finans6000
2Pazarlama4500
3Pazarlama5500
4İnsan Kaynakları7000
5Mühendislik8000
6Mühendislik9000

```df.groupby('Departman').mean()```

Bu kod, departmanlara göre maaşların ortalamasını hesaplar. Ortalama maaşlar aşağıdaki gibi olacaktır:

DepartmanMaaş
Finans5500
Pazarlama5000
İnsan Kaynakları7000
Mühendislik8500

Bu şekilde gruplama işlemleri oldukça kolay bir şekilde yapılabilmektedir. Ayrıca, concat fonksiyonu kullanılarak farklı veri setleri birleştirilebilir. Veri setleri birleştirilirken belirli bir sütuna göre birleştirme işlemi yapılabilir.

Örneğin, iki farklı müşteri listemiz olsun ve bunları birleştirmek istiyoruz:

İsimYaşMeslek
0Ahmet35Mühendis
1Ayşe28Doktor
2Burak41Avukat

ve

İsimYaşMeslek
0Can32Öğretmen
1Dilara45Mimar
2Emre39Doktor

Aşağıdaki kod ile bu iki veri seti birleştirilebilir:

```pd.concat([df1, df2])```

Bu şekilde iki farklı veri setini birleştirerek tek bir veri seti elde edebiliriz. Pandas kütüphanesi ile veri gruplama ve birleştirme işlemleri oldukça kolaydır ve çeşitli işlemler yapabilmeniz için ihtiyaç duyduğunuz tüm fonksiyonları sunar.