Veri Manipülasyonu ve Temizleme için Numpy Kullanımı

Veri Manipülasyonu ve Temizleme için Numpy Kullanımı

Veri manipülasyonu ve temizleme için Numpy kullanımı konusunda merak ediyorsanız doğru yerdesiniz! Bu makalede, verilerinizi hızlı ve kolay bir şekilde manipüle etmek için Numpy'nin gücünü keşfedeceksiniz Öğrenmek için hemen tıklayın!

Veri Manipülasyonu ve Temizleme için Numpy Kullanımı

Bugün veri biliminde, verileri analiz etmek ve işlemek için Numpy kütüphanesi oldukça popülerdir. Bu makalemizde, Python programlama dili için Numpy kullanarak veri manipülasyonu ve temizleme yöntemlerine bir göz atacağız. Numpy kullanarak verilerinizi nasıl daha verimli bir şekilde işleyebileceğinizi ve verilerinizin temizlenmesi için hangi yöntemlerin kullanılabileceğini öğreneceksiniz.

Veri manipülasyonu, verilerin belirli bir amaç için düzenlenmesi veya değiştirilmesidir. Veri oluşturma, ekleme, silme ve yer değiştirme gibi yöntemler yardımıyla basit veya karmaşık veri işlemleri gerçekleştirilebilir. Veri temizleme ise, verilerinizde eksik veya hatalı verileri tespit etmek ve bunları çıkarmak için kullanılan yöntemlerdir.

Bu makale, Numpy kütüphanesi kullanarak veri manipülasyonu ve temizleme yöntemlerinin incelenmesiyle devam edecek. Detaylı kod örnekleriyle birlikte, rastgele veri oluşturma, matris oluşturma, veri ekleme, silme ve yer değiştirme gibi temel veri manipülasyonu yöntemleri detaylı bir şekilde ele alınacaktır. Ayrıca veri temizleme işlemleri kapsamında, hatalı ve eksik verilerin tespit edilmesi ve temizlenmesi ile veri normalleştirme yöntemleri incelenecektir.


Veri Manipülasyonu

Bir veri bilimcisi için, veri manipülasyonu ve temizleme işlemleri oldukça önemlidir. Veriyi doğru şekilde oluşturmak, ekleme, silme, yer değiştirme gibi işlemler yaparak doğru şekilde analiz etmek ve sonuçlar karşısında doğru kararlar almak oldukça önemlidir. Numpy kütüphanesi bu işlemleri kolaylaştıran bir araçtır.

Bir veri seti oluşturma süreci oldukça zorlu bir süreçtir. Numpy kütüphanesi bu süreci kolaylaştıran birkaç fonksiyon içerir. İstenilen boyutta dizi oluşturmak, bu diziyi rastgele sayılarla doldurmak, farklı veritipleri kullanmak mümkündür. Numpy kütüphanesi ile 1D, 2D ve 3D matrisler oluşturmak mümkündür.

Fonksiyon İsmi Açıklaması
np.array() Bir diziyi oluşturmak için kullanılır.
np.zeros() Bir diziyi sıfırlarla doldurmak için kullanılır.
np.ones() Bir diziyi birlerle doldurmak için kullanılır.
np.random.rand() İstenilen boyutta rastgele sayılardan oluşan bir dizi oluşturmak için kullanılır.

Veri oluşturma işlemi tamamlandıktan sonra, bazen veri setlerinde düzenlemeler yapmak gerekebilir. Bu aşamada, Numpy kütüphanesi ile veri ekleme, silme ve yer değiştirme işlemleri yapılabilir. Matrislerde sütun, satır ve eleman eklemek veya silmek, elemanların yerini değiştirmek mümkündür. Bu işlemler veri analizinde oldukça önemlidir.

Fonksiyon İsmi Açıklaması
np.delete() Matrislerden sütun, satır veya eleman silmek için kullanılır.
np.insert() Matrislere sütun, satır veya eleman eklemek için kullanılır.
np.swapaxes() Matrislerde elemanların yerlerini değiştirmek için kullanılır.

Bu işlemler, veri analizinde doğru sonuçlar elde etmek için oldukça önemlidir. Veri manipülasyonu işlemlerini başarılı bir şekilde yapmak, veri bilimcileri için doğru kararlar almalarını kolaylaştırır. Numpy kütüphanesi ile bu işlemler oldukça kolay hale gelmektedir.


Veri Oluşturma

Veri manipülasyonu ve temizleme sürecinde en önemli adım, veri setinin kendisidir. Bu adımda, veri setinin oluşturulması ve farklı boyutlarda matrislerin oluşturulması işlemi gerçekleştirilir. Matematiksel işlemler için numpy kullanımı oldukça yaygındır. Bu nedenle, numpy kütüphanesi kullanarak veri oluşturma süreci oldukça kolay bir hale gelmektedir.

Numpy ile rastgele veri üretme oldukça basittir. Random modülü kullanarak numpy kütüphanesinde rastgele integer veya float sayılar oluşturmak mümkündür. Bu sayılar, hem veri manipülasyon sürecinde kullanılabilir, hem de veri oluşturma sürecinde kullanılabilir.

Numpy Fonksiyonu Açıklama
np.random.randint(low, high=None, size=None, dtype='l') Belirtilen düşük ve yüksek aralıkta rastgele integer sayılar oluşturur.
np.random.rand(d0, d1, …, dn) Belirtilen boyutta rastgele float sayılar oluşturur. 0 ile 1 arasında değerler döndürür.
np.random.randn(d0, d1, …, dn) Gauss (Normal) dağılımına sahip rastgele değerler oluşturur.

Veri oluşturma sürecinde ayrıca farklı boyutlarda matrislerin oluşturulması gerekmektedir. Numpy ile 1D, 2D ve 3D matrislerin nasıl oluşturulacağı hakkında bilgi sahibi olunması gerekmektedir. Basit bir örnek vermek gerekirse, 2D matris oluşturmak için numpy kullanımı aşağıdaki gibidir:

import numpy as nparr = np.array([[1, 2, 3], [4, 5, 6]])print(arr)

Bu kod bloğu, 2 satır ve 3 sütundan oluşan bir 2D matris oluşturur. Veri setinin boyutlarına göre, 1D, 2D ve 3D matrisler oluşturulabilir. Bu sayede, veri manipülasyonu ve temizleme süreçlerinin ilerleyen aşamalarında işlem yapmak oldukça kolay bir hale gelir.


Rastgele Veri Üretme

Numpy ile rastgele sayı üretmek için random modülü kullanılır. Bu modül, istenilen sayıda rastgele sayı üretmek için farklı fonksiyonlar sunar. Örneğin, numpy.random.rand() fonksiyonu, 0 ve 1 arasında rastgele sayılar üretir ve bu sayılar 1D array olarak döndürülür. Benzer şekilde, numpy.random.randint() fonksiyonu belirtilen aralıktaki rastgele integer sayılarını döndürür.

Bunun yanı sıra, numpy.random.normal() fonksiyonu normal dağılımdan rastgele sayılar döndürür. Bu fonksiyonun kullanımı için ortalaması ve standart sapması belirtilir. Ayrıca, numpy.random.shuffle() fonksiyonu da bir array'in elemanlarını karıştırarak rastgele sıralar.

Özetlemek gerekirse, rastgele veri üretmek için Numpy ile random modülü oldukça kullanışlıdır ve farklı fonksiyonları ile istenilen amaçlara uygun rastgele sayılar üretmek mümkündür.


Matris Oluşturma

Matris, bir düzlemde birçok sayıyı saklayan bir veri yapısıdır. Numpy kütüphanesi ile 1D, 2D ve 3D matrisler oluşturabilirsiniz.

1D matris, yalnızca bir satırdan oluşan matrisdir ve 1D matris oluşturmak için aşağıdaki örneği kullanabilirsiniz:

import numpy as npx = np.array([1, 2, 3, 4, 5])print(x)

2D matris, birçok satır ve sütundan oluşan matristir ve 2D matris oluşturmak için aşağıdaki örneği kullanabilirsiniz:

import numpy as npx = np.array([[1, 2], [3, 4], [5, 6]])print(x)

3D matris, 2D matrisin birleştirilmesiyle oluşan bir matristir ve 3D matris oluşturmak için aşağıdaki örneği kullanabilirsiniz:

import numpy as npx = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])print(x)

Ayrıca, farklı boyutlu matrisler oluşturmak için numpy'in birçok fonksiyonu vardır. Numpy ile matris oluşturma hakkında daha fazla bilgiye numpy dokümantasyonundan ulaşabilirsiniz.


Veri Ekleme, Silme ve Yer Değiştirme

Veri manipülasyonu işlemleri sırasında veri ekleme, silme ve yer değiştirme gibi işlemler oldukça yaygın olarak kullanılır. Numpy kütüphanesi de bu işlemler için kullanabileceğiniz birçok farklı fonksiyona sahiptir.

Veri Ekleme: Matrislerde sütun, satır veya eleman eklemek için kullanabileceğiniz numpy fonksiyonları aşağıdaki gibidir:

Fonksiyon Açıklama
numpy.append() Matrisin sonuna yeni bir sütun veya satır ekler
numpy.insert() Belirtilen konuma yeni bir sütun veya satır ekler
numpy.concatenate() İki veya daha fazla matrisi birleştirerek yeni bir matris oluşturur

Veri Silme: Matrislerden sütun, satır veya eleman silmek için kullanabileceğiniz numpy fonksiyonları aşağıdaki gibidir:

Fonksiyon Açıklama
numpy.delete() Belirtilen sütun veya satırı siler
numpy.trim_zeros() Sıfır elemanları silerek matrisi kısaltır

Yer Değiştirme: Matrislerde elemanların yerlerini değiştirmek için kullanabileceğiniz numpy fonksiyonları aşağıdaki gibidir:

Fonksiyon Açıklama
numpy.roll() Matrisi belirtilen sayıda öteleyerek elemanları yer değiştirir
numpy.swapaxes() Matrisin belirtilen ekseni etrafında elemanların yerlerini değiştirir

Bu fonksiyonların kullanımıyla, veri manipülasyonu işlemlerinde kolaylık sağlanabilir ve verinin istenen hale getirilmesi sağlanabilir.


Veri Ekleme

Numpy ile matrislerde veri ekleme işlemleri oldukça basittir. Bir matrisin herhangi bir yerine yeni bir eleman, satır veya sütun ekleyebilirsiniz. Bunun için kullanabileceğiniz bazı yöntemler şunlardır:

  • np.append() : Bu fonksiyon, matrisin en sonunda yeni bir satır veya sütun eklemek için kullanılır. Örnek olarak, np.append(matris, [[5,6,7]], axis=0) kodu ile matrisin en sonuna yeni bir satır eklenebilir.
  • np.insert() : Bu fonksiyon, matrisin herhangi bir yerine yeni bir eleman, satır veya sütun eklemek için kullanılır. Örnek olarak, np.insert(matris, 1, [4,5,6], axis=0) kodu ile matrisin 1. satırına yeni bir satır eklenebilir.
  • np.concatenate() : Bu fonksiyon, iki matrisi birleştirmek için kullanılır. axis parametresi ile birleştirilecek matrisin hangi yönde birleştirileceği belirtilir. Örnek olarak, np.concatenate((matris1, matris2), axis=1) kodu ile matrisleri yanyana birleştirebilirsiniz.
Fonksiyon Ne İşe Yarar? Kullanımı
np.append() Matrisin en sonuna yeni bir satır veya sütun eklemek için kullanılır. np.append(matris, [[5,6,7]], axis=0)
np.insert() Matrisin herhangi bir yerine yeni bir eleman, satır veya sütun eklemek için kullanılır. np.insert(matris, 1, [4,5,6], axis=0)
np.concatenate() İki matrisi birleştirmek için kullanılır. np.concatenate((matris1, matris2), axis=1)

Veri ekleme işlemleri, özellikle büyük veri setleri üzerinde çalışırken oldukça önemlidir. Numpy kütüphanesi, bu işlemleri hızlı ve etkili bir şekilde yapmanızı sağlar. Bu yöntemleri kullanarak, istediğiniz herhangi bir veri ekleme işlemi gerçekleştirebilirsiniz.


Veri Silme

Veri manipülasyonu işlemleri sırasında, bazen matrislerdeki belirli sütunlar, satırlar veya elemanlar kullanılmayabilir veya hatalı olabilir. Bu durumda, Numpy kütüphanesi ile kolayca sütun, satır veya eleman silinebilir.

Matrislerde belirli sütunları silmek için, np.delete() fonksiyonu kullanılır. Bu fonksiyon, verilen matrisin sütun indekslerine göre yeni bir matris oluşturur.

Kod Çıktı
matris = np.array([[1,2,3],[4,5,6],[7,8,9]])
np.delete(matris, 1, 1)
array([[1, 3],
[4, 6],
[7, 9]])

Bu örnekte, np.delete() fonksiyonu, matrisin 1. sütununu sildi ve geriye kalan sütunları yeni bir matris olarak döndürdü.

Belirli satırları silmek için, aynı fonksiyon kullanılır, ancak axis parametresi 0 olarak belirtilir.

Kod Çıktı
matris = np.array([[1,2,3],[4,5,6],[7,8,9]])
np.delete(matris, 1, 0)
array([[1, 2, 3],
[7, 8, 9]])

Bu örnekte, matrisin 1. satırı silinmiş ve geriye kalan satırlar yeni bir matris olarak döndürülmüştür.

Aynı şekilde, belirli bir elemanı silmek için np.delete() fonksiyonu kullanılabilir. Bunun için, matrisin satır ve sütun indeksleri belirtilir.

Kod Çıktı
matris = np.array([[1,2,3],[4,5,6],[7,8,9]])
np.delete(matris, (1,2), 0)
array([[1, 2, 3]])

Bu örnekte, matrisin 1. satırı ve 2. satırının 1., 2. ve 3. elemanları silinmiş ve geriye kalan elemanlar yeni bir matris olarak döndürülmüştür.


Yer Değiştirme

Veri manipülasyonu işlemlerinden biri de matrislerde elemanların yer değiştirmesi işlemidir. Numpy kütüphanesi kullanarak matrislerde elemanları farklı pozisyonlarda yer değiştirme işlemi yapabilirsiniz.

Yer değiştirme işleminin yapılabilmesi için Numpy kütüphanesinde yer alan reshape fonksiyonu kullanılır. Bu fonksiyon, matris içerisindeki elemanların farklı şekillerde yeniden düzenlenmesine olanak sağlar.

Bunun yanı sıra, Numpy kütüphanesinde yer alan swapaxes fonksiyonu ile de matris içerisindeki elemanların yerleri değiştirilebilir. Özellikle çok boyutlu matrislerde kullanışlı bir fonksiyondur. Aşağıdaki örneklerde bu fonksiyonun kullanımına örnekler verilmiştir:

Örnek Kod Açıklama
np.swapaxes(matris,0,1) Matris içerisindeki satır ve sütunları yer değiştirir.
np.swapaxes(matris,1,2) 3D matrislerde, elemanların sabit kaldığı boyutlar içerisinde yer değiştirir.

Bu işlemler, veri manipülasyonu ve temizleme işlemlerinde oldukça önemlidir. Yer değiştirme işlemi sayesinde matris içerisindeki elemanlar farklı pozisyonlarda kullanılabileceği gibi, normalleştirme işlemleri gibi farklı işlemlerde de kullanılabilirler.


Veri Temizleme

Veri temizleme, veri setlerindeki hatalı veya eksik verilerin temizlenmesi ve veri normalleştirme yöntemlerini kapsar. Bu işlem, veri analizi ve veri madenciliğinde önemli bir adımdır, çünkü hatalı veya eksik veriler, sonuçların yanıltıcı olmasına neden olabilir. Numpy ile bu işlemleri kolayca yapabilirsiniz.

Veri temizleme işlemi, veri setindeki hatalı veya eksik verilerin tespit edilmesini ve bunların doğru bir şekilde temizlenmesini kapsar. Numpy ile NaN değerleri ve sıfır değerlerini tespit edebilir ve bu değerleri doğru bir şekilde temizleyebilirsiniz. NaN değerleri, belirli bir değeri ifade etmeyen, eksik veya bilinmeyen verilerdir. Bu değerleri tespit etmek için, isnan() fonksiyonunu kullanabilirsiniz.

Sıfır değerleri, dolaylı yoldan eksik verileri ifade edebilir ve bu verileri doğru bir şekilde temizlemek gereklidir. Numpy ile bu işlemi yapmak için, where() fonksiyonunu kullanabilirsiniz. Bu fonksiyon, belirli bir koşulu sağlayan elemanları seçer ve aynı koşulu sağlayan elemanları belirli bir değerle değiştirir.

Veri normalleştirme, veri setindeki verilerin ölçeklendirilmesi işlemidir. Bu işlem, veri setindeki verilerin aynı ölçekte olmasını sağlar ve sonuçların daha doğru olmasına yardımcı olur. Numpy ile bu işlemi yapmak için, Z-Skorlama ve MIN-MAX Dönüşümü yöntemlerini kullanabilirsiniz.

Z-Skorlama yöntemi, verilerin ortalaması ve standart sapma kullanılarak verilerin ölçeklendirilmesini sağlar. Bu yöntem, verilerin normal bir dağılım oluşturmasını sağlar ve sonuçların daha anlamlı olmasını sağlar.

MIN-MAX Dönüşümü yöntemi, verileri belirli bir aralıkta (genellikle 0 ila 1 arasında) ölçeklendirir. Bu yöntem, verilerin orijinal değerlerine sadık kalırken, verilerin aynı ölçekte olmasını sağlar.

Sonuç olarak, Numpy kütüphanesi kullanarak veri temizleme ve normalleştirme işlemlerini kolayca yapabilirsiniz. Bu işlem, sonuçların daha doğru ve anlamlı olmasını sağlar ve veri analizi ve madenciliği işlemlerinde önemli bir adım olarak karşımıza çıkar.


Veri Setindeki Hatalı veya Eksik Verilerin Temizlenmesi

Veri setlerinde eksik veya hatalı veriler sıklıkla karşılaşılan sorunlardandır. Bu sorunlar, verilerin işlenmesinde hatalara neden olabilir ve sonuçların doğru olmamasına sebep olabilir. Numpy kütüphanesi ile hatalı veya eksik verilerin tespiti ve temizlenmesi oldukça kolaydır.

NaN(Not a Number) değerleri, bir veri setinde boş veya geçersiz verileri ifade eder. Bu değerler, veri analizi sonucunda karşımıza çıktığında, çözümlemeyi olumsuz yönde etkiler. Numpy, NaN değerlerinin tespiti ve temizlenmesi için birçok fonksiyon içerir. Örneğin, np.isnan() fonksiyonu, bir matristeki NaN değerlerini True olarak döndürür ve bu değerlere, matristen kolayca erişilebilir.

Sıfır değerleri, veri setlerinde yaygın olarak görülen başka bir hatalı veya eksik veri türüdür. Numpy, sıfır değerlerini tespit etmek için np.where() fonksiyonunu kullanır. Bu fonksiyon, sıfır değerlerinin indekslerini bulduktan sonra, istenilen bir değer ile değiştirerek temizlemeyi gerçekleştirir.

Yukarıdaki yöntemler, Numpy kütüphanesi ile hatalı veya eksik verilerin tespiti ve temizlenmesi için kullanılan ana yöntemlerdir. Bu fonksiyonlar, veri setinizdeki hatalı veya eksik verilerin temizlenmesi için oldukça yararlıdır ve doğru sonuçların elde edilmesine yardımcı olacaktır.


NaN Değerler

NaN, "not a number" anlamına gelir ve veri setlerinde sıkça karşılaşılan bir durumdur. Numpy kullanarak NaN değerlerin tespiti ve temizlenmesi oldukça kolaydır. Öncelikle, veri setindeki NaN değerlerin tespiti "isnan()" fonksiyonuyla yapılabilir. Bu fonksiyon, veri setindeki her bir elemanı kontrol eder ve değeri NaN olan elemanları True, diğer elemanlar ise False olarak döndürür. Daha sonra, NaN değerlerin temizlenmesi için "nan_to_num()" fonksiyonu kullanılabilir. Bu fonksiyon, NaN değeri olan elemanları 0'a dönüştürür.

Örnek olarak, bir matris oluşturulduğunu ve içinde NaN değeri bulunduğunu düşünelim:

1 2 3
4 NaN 6
7 8 NaN

Yapılacak işlem, öncelikle "isnan()" fonksiyonu kullanarak NaN değerlerin tespit edilmesi:

  • isnan(matris)

Bu komut, yukarıdaki örnekteki matris için aşağıdaki sonucu verecektir:

False False False
False True False
False False True

NaN değerleri True olarak işaretlendi. Daha sonra, "nan_to_num()" fonksiyonu kullanarak NaN değerlerin temizlenmesi yapılabilir:

  • matris = np.nan_to_num(matris)

Bu fonksiyon, NaN değerlerini 0'a dönüştürür. İşlem sonucunda elde edilen matris şu şekildedir:

1 2 3
4 0 6
7 8 0

Böylece, Numpy kullanarak NaN değerlerin tespiti ve temizlenmesi oldukça kolay bir işlemdir.


Sıfır Değerleri

Sıfır değerleri, veri setlerinde sıkça karşılaşılan bir durumdur. Numpy kütüphanesi ile bu değerlerin tespiti ve temizlenmesi oldukça basit bir şekilde gerçekleştirilebilir.

Sıfır değerlerinin tespiti için, numpy.where() fonksiyonu kullanılabilir. Bu fonksiyon, bir koşulu sağlayan elemanların dizideki indislerini döndürür. Örneğin:

Kod Sonuç
import numpy as np
arr = np.array([[1, 2, 0], [0, 3, 4], [0, 0, 5]])
result = np.where(arr == 0)
(array([0, 1, 2, 2]), array([2, 0, 0, 1]))

Bu kod bloğunda, arr adlı bir numpy dizisi tanımlanmış ve numpy.where() fonksiyonu ile sıfır değerleri tespit edilmiştir. Fonksiyonun döndürdüğü sonuçta, sıfır değerlerinin yer aldığı satır ve sütun indisleri görülmektedir.

Sıfır değerlerinin temizlenmesi için de numpy.where() fonksiyonu kullanılabilir. Bu sefer fonksiyon, koşulu sağlayan elemanların yerine belirli bir değer koyar. Örneğin:

Kod Sonuç
import numpy as np
arr = np.array([1, 2, 0, 0, 3, 0])
arr[np.where(arr == 0)] = 99
array([ 1, 2, 99, 99, 3, 99])

Bu kod bloğunda, arr adlı bir numpy dizisi tanımlanmış ve sıfır değerleri numpy.where() fonksiyonu ile tespit edilmiştir. Daha sonra, sıfır değerleri yerine 99 değeri koyulmuştur.

Numpy kütüphanesi sayesinde sıfır değerleri tespit edilip temizlenebilir, böylece veri setleri daha doğru analiz edilebilir.


Veri Normalleştirme

Veri normalleştirme, bir veri setindeki değişkenlerin farklı ölçeklere sahip olması durumunda yapılır. Bu normalleştirme işlemi, veri setinin daha doğru bir şekilde analiz edilmesine olanak tanır. Numpy ile veri normalleştirme işlemleri yapmak oldukça kolaydır.

Numpy'de iki adet veri normalleştirme yöntemi vardır. Bunlar, Z-Skorlama ve MIN-MAX Dönüşümü yöntemleridir.

Z-Skorlama yöntemi, bir veri setinin ortalama ve varyansından yararlanarak, verileri standart normal dağılıma dönüştürür. Bu yöntem, veri setindeki değişkenleri ortalama sıfır ve standart sapması bir olan bir dağılıma sahip olacak şekilde dönüştürür. Bu şekilde, verilerin farklı ölçeklerinin ortadan kaldırılması ile birlikte, daha doğru bir şekilde karşılaştırma yapılabilir.

MIN-MAX Dönüşümü yöntemi ise bir veri setinin minimum ve maksimum değerlerinden yararlanarak verileri normalleştirir. Bu yöntem, bir veri setindeki en küçük ve en büyük değerler arasında olan tüm verileri 0-1 aralığına dönüştürür. Bu şekilde, tüm değişkenlerin aynı ölçekte olmasını ve verilerin daha doğru bir şekilde karşılaştırılabilmesini sağlar.

Numpy ile veri normalleştirme işlemini yapmak oldukça kolaydır. Bu işlem için normalize() fonksiyonu kullanılır. Bu fonksiyon, belirtilen normalleştirme yöntemine göre veri setindeki değişkenleri dönüştürür. Aşağıdaki örnek kodlar, Z-Skorlama yöntemi ve MIN-MAX Dönüşümü yöntemini kullanarak veri normalleştirme işlemini göstermektedir.

```pythonimport numpy as np

# Z-Skorlama Yöntemidata = np.array([[10, 20, 30], [5, 15, 25], [2, 8, 14]])

normalized_data = (data - np.mean(data)) / np.std(data)print(normalized_data)

# MIN-MAX Dönüşümü Yöntemidata2 = np.array([[10, 20, 30], [5, 15, 25], [2, 8, 14]])

normalized_data2 = (data2 - np.min(data2)) / (np.max(data2) - np.min(data2))print(normalized_data2)```

Yukarıdaki kodu çalıştırdığınızda veri setindeki tüm değişkenlerin normalleştirilmiş hallerini elde edebilirsiniz. Normalleştirilmiş veriler daha doğru bir şekilde analiz edilebilir ve sonuçlar daha doğru olur.


Z-Skorlama

Z-Skorlama, verinin ortalamasının sıfır olmasını ve standart sapmasının bir olmasını sağlayarak verilerin normalleştirilmesi için sıklıkla kullanılan bir yöntemdir. Numpy ile Z-Skorlama, her bir veri noktasının ortalamadan çıkarılarak standart sapmaya bölünmesiyle gerçekleştirilebilir. Bu sayede veri setinin birçok analizi daha doğru hale gelir.

Aşağıda, Numpy ile Z-Skorlama yönteminin nasıl kullanılacağına dair bir örnek verilmiştir:

Örnek Veri SetiZ-Skorlama Uygulanmış Veri Seti
[2, 4, 6, 8, 10]
[-1.26491106, -0.63245553, 0., 0.63245553, 1.26491106]

Yukarıdaki örnek veri seti için, ilk olarak verilerin ortalaması hesaplanır. Bu durumda, ortalaması 6 olacaktır. Ardından, her bir veri noktasından ortalaması çıkarılır ve elde edilen sonuç standart sapmaya bölünür. Bu hesaplama sonucu ile elde edilen veri seti Z-Skorlama yöntemi ile normalleştirilmiş veri setidir.


MIN-MAX Dönüşümü

Numpy kütüphanesi ile veri normalleştirme işlemleri MIN-MAX Dönüşümü yöntemi ile gerçekleştirilebilir. Bu yöntem, veri değerlerini 0-1 arasında bir aralığa dönüştürür. Bu yöntemin bir başka adı da ölçeklendirme yöntemidir. MIN-MAX Dönüşümü yöntemi, veri setindeki değerleri belirli bir aralıkta birleştirmek için kullanılır.

Bu yöntem, verileri otomatik olarak ölçeklendirebilir. Bu normalizasyon yöntemi, veri aralığını sabit bir aralığa taşır. Bu işlem, özellikle derin öğrenme modelleri için gereklidir. Ayrıca, veri setindeki aykırı değerlerin tespiti ve normalizasyonu için de kullanılabilir. MIN-MAX Dönüşümü yöntemi birkaç basit adımda gerçekleştirilebilir.

Adım Açıklama
1 Veri setindeki en küçük değerin belirlenmesi (min)
2 Veri setindeki en büyük değerin belirlenmesi (max)
3 Veri setindeki her bir değer için (değer-min)/(max-min) işlemi uygulanması

Bu işlemler sonrasında, veri setindeki her bir değer, belirtilen aralıkta yeni bir değere dönüştürülür. Bu işlem sonucunda, veri setindeki değerler birbirleriyle karşılaştırılabilir hale gelirler.

Özellikle derin öğrenme modelleri için, veri normalizasyonu çok önemlidir. Bu sayede, modelin yapacağı tahminlerde daha iyi sonuçlar alınabilir. Bu yöntem sayesinde, veri setindeki değerler arasındaki ilişkiler daha net bir şekilde görülebilir ve modelin doğru sonuçlar üretmesi sağlanır. MIN-MAX Dönüşümü yöntemi, veri setleri üzerindeki normalizasyon işlemleri için oldukça etkili bir yöntemdir.