Veri analitiği alanında Python programlama dili temel bir araçtır Bu eğitimde Python'un temel özellikleri ve veri analitiği için kullanımı anlatılmaktadır Veri analitiğinde başarılı olmak isteyenlere önerilir
Veri analitiği, günümüz dünyasında büyük bir değer taşıyan bir konudur. Özellikle işletmeler için, doğru kararları alabilmek için verilerin analiz edilmesi büyük önem taşır. Bu nedenle, Python gibi bir dilden yararlanarak veri analizinin temellerini öğrenmek oldukça faydalı olabilir.
Bu makalede, Python programlama dilinin temel konuları tartışılacaktır. Değişkenler, veri türleri, aritmetik işleçler, karakter dizileri ve kontrol yapıları gibi konular ele alınacaktır. Ayrıca, veri analitiği çalışmalarında en çok kullanılan kütüphaneler olan Numpy ve Pandas da tartışılacaktır.
Python Programlama Dili
Python, son dönemde birçok alanda kullanılan ve dünya genelinde popülaritesi artan bir programlama dilidir. Yapısı itibariyle oldukça anlaşılır, kolay bir öğrenme eğrisine sahiptir ve kodlama işleminde büyük kolaylık sağlar.
Python, geniş bir kütüphane yelpazesi sunarak birçok işlemin yapılabilmesini mümkün kılmaktadır. Yüksek performansı ile birlikte, web, veri analitiği, yapay zeka, ağ programlama gibi birçok alanda kullanımı mevcuttur.
Yalın bir sözdizimi sayesinde okunaklı ve anlaşılır kodlar yazmak mümkündür. Ayrıca, Python, açık kaynak kodlu bir yazılımdır ve çok sayıda insan tarafından kullanılmaktadır. Bu nedenle, geliştiriciler arasında geniş bir destek topluluğuna sahiptir ve sürekli olarak güncellenmektedir.
Python, öğrenmesi ve kullanması kolay olan bir programlama dilidir ve diğer birçok programlama diline geçiş yapmak isteyenler için de iyi bir başlangıç noktasıdır.
Değişkenler ve Veri Türleri
Veri analitiği çalışmalarında Python, çok yaygın olarak kullanılan bir programlama dili haline gelmiştir. Python'da değişkenler, farklı veri türlerini (sayılar, metinler, vb.) saklamak için kullanılır. Python'da kullanılan bazı veri türleri şunlardır:
- Sayılar: Tam sayılar (int), ondalık sayılar (float) ve karmaşık sayılar (complex) dahil olmak üzere farklı sayı türleri mevcuttur.
- Metin (string): Tek tırnak veya çift tırnak kullanılarak tanımlanır. Metinler, dize işleme fonksiyonları için hazır özelliklere sahiptir.
- Listeler: Birden çok öğeyi içeren ve köşeli parantez işareti kullanılarak tanımlanan bir veri yapısıdır. Listeler, değiştirilebilir ve sıralıdır.
- Tuplelar: Listeler gibi öğeleri saklar, ancak değiştirilemezler.
- Sözlükler: Anahtar-değer çiftleri şeklinde saklanır ve süslü parantezler kullanılarak tanımlanır. Değiştirilebilir veri yapısıdır.
Değişkenler, programlama sürecinde tekrar kullanılmak üzere bir değeri tutarlar. Her değişkenin bir adı vardır ve adı kullanılarak içindeki veriye erişilir. Değişkenler atama işleci (=) kullanılarak tanımlanır.
Örneğin, a değişkenine 5 değerini atamak için a = 5
yazabilirsiniz. Bu, a değişkeninin 5'e eşit olduğunu gösterir. Değişken isimleri harf, sayı ve alt çizgi (_) gibi karakterleri kullanabilir, ancak rakam ile başlayamazlar.
Python'da değişkenler ve veri türleri, veri analizi ve işleme işlemlerinde temel bir role sahiptir. Değişkenler ve bu değişkenlerin tuttuğu veri türleri veri kaynaklarından alınan ve işlenen verilerin doğru bir şekilde saklanmasına izin verir.
Aritmetik İşleçler
Python, aritmetik işleçleri standart olarak destekleyen bir programlama dilidir. Toplama (+), çıkarma (-), çarpma (*), bölme (/) gibi işleçler kullanıma açıktır ve öncelik sırası da benzer diğer programlama dilleriyle aynıdır. İşlemlerin sonuçları, değerleri saklanabilen değişkenlere atanabilir ya da ekrana yazdırılabilir.
Ayrıca, Python'da mod (remainder) alma işlemi için % işleci kullanılırken, üs alma işlemi için ** işleci kullanılır. Bunun yanı sıra, işlemler arasında öncelik sorunu oluşmaması için parantezler () kullanılabilir.
Toplama işlemi gibi basit işlemler için aritmetik işleçler kullanılabilirken, daha karmaşık matematiksel işlemler için de Python'da bazı fonksiyonlar bulunur.
Örneğin:
İşlem | Kod | Sonuç |
---|---|---|
Karekök Hesabı | import math math.sqrt(25) | 5.0 |
Logaritma Hesabı | import math math.log10(100) | 2.0 |
Sinüs Hesabı | import math math.sin(45) | 0.85090352453 |
Bu örneklerde de görülebileceği gibi, matematiksel hesaplamalar yapmak için Python'da hazır kütüphaneler kullanılabilir.
Karakter Dizileri
Python'da karakter dizileri, metinler ve karakterlerin belirli sıralamaları olarak kullanılır. Karakter dizileri, tek tırnak (' '), çift tırnak (" "), veya üçlü tırnaklar(""" """) arasında belirtilir.
Python, karakter dizileri üzerinde birçok işlem yapmanıza izin verir. Örneğin, karakter dizileri birbirine eklemek için '+' işleci kullanılır ve bir karakter dizisinin bir bölümüne erişmek için indeksleme kullanılır. Ayrıca, karakter dizileri ters çevirebilir, parçalayabilir, ve alt küme seçebilirsiniz. Bir karakter dizisinin uzunluğunu öğrenmek için len() fonksiyonu kullanılır.
İşte birkaç örnek:
İşlem | Tanım |
---|---|
+ | Karakter dizilerini birleştirir. |
[] | Belirli bir karakteri veya karakter dizisini indeksleme ile seçer. |
[::] | Belirli bir alt küme seçer. |
len() | Karakter dizisinin uzunluğunu öğrenir. |
Örneğin, şu kod karakter dizisi "Merhaba" üzerinde birkaç işlem yapar:
- Karakter dizisinin uzunluğunu öğrenmek: len("Merhaba")
- İlk karakteri seçmek: "Merhaba"[0]
- İkinci karakterden sonraki alt kümenin seçimi: "Merhaba"[1:]
- İlk iki harfi seçmek: "Merhaba"[0:2]
- Karakter dizilerini birleştirme: "Merhaba" + "Dünya"
Karakter dizileri, yazılım geliştirme sürecinde kullanılan anahtar veri türlerinden biridir. Python, karakter dizileri üzerinde birçok işlem yapabilen basit bir programlama dili sunar.
Kontrol Yapıları
Python, programlama dilinde kod akışını kontrol etmek için bazı yapılar sağlar. Bunlar if, for ve while gibi yapılar olarak adlandırılır. Bu yapılar, koşullara göre belirli kod bloklarının çalıştırılmasını, döngülerin oluşturulmasını ve kodun belirli bir sayıda tekrarlanmasını sağlar.
if yapısı, belirli bir koşulun doğru olup olmadığını kontrol eder ve eğer koşul doğruysa belirli bir kod bloğu çalıştırılır. Örneğin, bir sayının belirli bir değere eşit veya büyük olduğunu kontrol etmek için if yapısı kullanılabilir.
for döngüsü, belirli bir kod bloğunun belirli bir sayıda tekrarlanmasını sağlar. Örneğin, bir listedeki tüm öğelerin üzerinde işlem yapmak için for döngüsü kullanılabilir.
while döngüsü de belirli bir koşul doğru olduğu sürece belirli bir kod bloğunun tekrarlanmasını sağlar. Örneğin, bir sayının belirli bir değere ulaşıncaya kadar belirli bir işlemi tekrarlamak için while döngüsü kullanılabilir.
Bu kontrol yapıları, Python programlama dilinde veri analitiği çalışmalarında oldukça önemlidir ve bu yapıları kullanarak veri manipülasyonu, analizi veya modelleme gibi işlemler yapmak mümkündür.
Numpy ve Pandas
Numpy ve Pandas, veri analitiği çalışmalarında kullanılan popüler Python kütüphaneleridir. Numpy, sayısal işlemler yapmak için kullanılan bir kütüphanedir ve çok boyutlu diziler, matrisler ve lineer cebir fonksiyonları içerir.
Pandas ise, veri manipülasyonu ve analizi için kullanılan bir kütüphanedir. Veri yapılarını (DataFrame, Series) ve çeşitli işlevleri (seçim, işleme, vb.) içerir. Özellikle, verilerin hazırlanması, temizlenmesi ve dönüştürülmesinde büyük bir destek sağlar.
- Numpy özellikleri şunlardır:
- Yüksek performanslı sayısal işlemler için çok boyutlu diziler, matrisler, vb. oluşturma ve manipüle etme imkanı sağlayan bir kütüphanedir.
- Lineer cebir fonksiyonları, Fourier dönüşümleri, rasgele sayı üretimleri gibi birçok matematiksel işlevi içerir.
- Bir Python koleksiyonu olarak oluşturulduğu için, diğer Python kütüphaneleriyle kolay bir entegrasyon sağlar.
- Pandas özellikleri şunlardır:
- Birçok veri kaynağından (csv, excel, sql, vb.) veri okuma ve yazma işlemleri ile veri işleme işlevleri sağlar.
- Veri manipülasyonu için yüksek performanslı bir şekilde çalışır ve büyük veri setleri üzerinde rahatlıkla işlem yapar.
- DataFrame'ler ve Series'ler gibi veri yapılarına ek olarak, yeniden şekillendirme, birleştirme, dilimleme, vb. işlemleri destekler.
- Veri görselleştirme için de kullanılabilir ve matplotlib gibi diğer Python görselleştirme kütüphaneleriyle güzel grafikler üretebilir.
Genel olarak, Python ve özellikle Numpy ve Pandas, veri bilimcilerin en çok kullandığı araçlardan biridir. Bu kütüphaneler, veri setlerini kolayca analiz etme, işleme ve görselleştirmede büyük bir kolaylık sağlar. Birçok büyük şirket, finansal kuruluşlar ve üniversitelerde, veri bilimciler ve veri analistleri tarafından kullanılır. Ancak Python ve bu kütüphaneler sadece veri analizi gibi konularda değil, diğer birçok alanda da oldukça faydalıdır.
Numpy
Numpy, veri analitiği çalışmalarında sayısal işlemler yapmak için kullanılan bir Python kütüphanesidir. Temel olarak çok boyutlu diziler, matrisler ve lineer cebir fonksiyonları içerir. Bu kütüphane, yüksek performans ve verimlilik sağlamak için C dilinde yazılmıştır. Numpy ile birçok matematiksel işlem yapılabilir. Örneğin, vektör ve matris işlemleri, Fourier dönüşümleri, rastgele sayı oluşturma, vb. yapmak mümkündür.
Numpy'da, tek boyutlu dizilerden çok boyutlu dizilere kadar farklı boyutlarda diziler tanımlanabilir ve işlemler yapılabilir. Matris işlemlerinde, transpoze alma, matris çarpımı, invers alma gibi birçok fonksiyon ve işlem bulunur. Numpy kütüphanesi kullanılarak elde edilen sonuçlar, matplotlib kütüphanesi yardımıyla görselleştirilebilir.
Numpy ayrıca, birçok veri analitiği işlemi için önemli bir araçtır. Bağımsız değişkenlerin matris hallerinin belirlenmesi ve model oluşturma gibi işlemler yapılabilir. Özellikle, veri boyutları büyük olduğunda Numpy, işlem hızı ve performansı nedeniyle çok kullanışlı bir kütüphanedir.
Numpy'i kullanmak için, öncelikle kütüphaneyi yüklemek gerekmektedir. Bunun için, "import numpy as np" komutu kullanılır. Daha sonra, çok boyutlu dizi tanımlamak için "np.array()" fonksiyonu kullanılır. Ayrıca, matris çarpımı, transpoze alma, indirgeme işlemleri gibi birçok fonksiyon Numpy kütüphanesi içerisinde yer almaktadır.
Örnek Kod | Açıklama |
---|---|
x=np.array([1, 2, 3]) | 1 boyutlu bir dizi tanımlar |
y=np.array([[1, 2], [3, 4]]) | 2 boyutlu bir dizi tanımlar |
z=np.dot(x, y) | x ve y dizilerinin matris çarpımını hesaplar |
Numpy kullanımı oldukça kolay ve veri analitiği çalışmalarında sıklıkla kullanılan bir kütüphanedir.
Pandas
Pandas, Python dilindeki en popüler veri manipülasyonu ve analizi kütüphanesidir. Pandas kullanıcıları, farklı veri kaynaklarından aldıkları verileri DataFrame ve Series adı verilen veri yapılarına dönüştürebilirler. DataFrame, tablo şeklinde düzenlenen ve her bir sütunun farklı bir veri türüne sahip olduğu verileri tutan bir veri yapısıdır. Series ise DataFrame'deki bir sütunun tek başına alınmış hali olarak düşünülebilir.
Pandas, veri analitiği çalışmalarında oldukça tercih edilen bir kütüphanedir. Verileri işlemek ve analiz etmek için birçok fonksiyon ve işlev barındırır. Verilerin seçiminde, işlenmesinde, kaynaklar arasında birleştirilmesinde ve daha birçok konuda kullanılabilir. Başka bir deyişle, Pandas sayesinde verileri kolaylıkla işleyebilir ve analiz edebilirsiniz.
Bunların yanı sıra, Pandas'ın bazı yararlı özellikleri de vardır. Örneğin, verilerdeki eksik değerleri tanımlama ve bu değerleri doğru şekilde işleme yeteneği gibi. Aynı zamanda, kullanıcılarına verileri görselleştirme işlemi için farklı çıktı biçimleri sunar.
Veri analitiği çalışmalarında Pandas kullanımı oldukça önemlidir. Pandas'ın kullanımı sayesinde, verileri kolaylıkla işleyebilir ve temel analizler yapabilirsiniz. Aynı zamanda, birçok ticari kuruluş ve kuruluşlar tarafından kullanılarak verilerin yönetimi ve analizi daha hızlı ve kolay hale getirilir.