Pandas ile Excel işlemleri yapmak artık çok kolay! Bu makalede veri aktarma ve dışa aktarma yöntemleri anlatılıyor Verilerinizi daha hızlı ve pratik bir şekilde yönetin Detaylar için tıklayın!

Birçok işlemde Excel dosyaları kullanılır ve bunların büyük kısmı veri işleme işlemleridir. Verileri doğru bir şekilde işlemek için ise pandas kütüphanesi oldukça kullanışlı bir araçtır. Bu makalede, pandas kütüphanesi ile Excel dosyalarından veri aktarma ve dışa aktarma işlemlerinin nasıl yapılacağı ele alınacaktır.
Veri aktarma işlemi, Excel dosyalarından veri okunması, verilerin kontrol edilmesi, işlenmesi ve veri çerçevesi oluşturulması aşamalarından oluşur. İlk olarak, veri okunması işlemi için pandas'ın read_excel() fonksiyonu kullanılır. Okunan verilerin doğru bir şekilde yüklendiğinden emin olmak için head() fonksiyonu kullanılabilir. Okunan veriler üzerinde işlem yapmak için ise, pandas'ın sunduğu birçok fonksiyon kullanılabilir. Veriler, veri çerçevesi olarak oluşturulur ve işlemler veri çerçevesi üzerinde yapılır.
Veri dışa aktarma işlemi, veri yazdırma işlemleri olarak adlandırılır ve pandas kütüphanesi ile oldukça kolay bir şekilde yapılabilir. Veriler Excel dosyasına veri yazdırma veya CSV dosyasına yazdırma şeklinde olabilir. Verilerin Excel dosyasına yazdırılması için to_excel() fonksiyonu kullanılırken, verilerin CSV dosyasına yazdırılması için to_csv() fonksiyonu kullanılır.
Pandas Kütüphanesi Nedir?
Pandas, Python programlama dilinde kullanılan ve veri analizi işlemleri yapmak için kullanılan bir kütüphanedir. Pandas'ın amacı, verileri analiz etmek ve manipüle etmek için kullanıcılara yapay zeka özellikleri sunmaktır. Pandas, verileri okuma, filtreleme, gruplama, birleştirme, yeniden şekillendirme ve daha pek çok işlemi mümkün kılan fonksiyonlara sahiptir.
Ayrıca Pandas, veri analizi için kullanılan diğer kütüphanelerle uyumlu çalışır. Bu kütüphaneler arasında NumPy, Matplotlib, Scikit-learn ve daha pek çok kütüphane yer almaktadır. Pandas, kullanışlı bir işlevsellik sunması nedeniyle veri bilimcileri ve analistler tarafından yaygın olarak tercih edilmektedir.
Veri Aktarma
Excel dosyalarından veri aktarma işlemi yapmak, pandas kütüphanesi sayesinde oldukça basittir. Python programlama dilinde kullanılan pandas kütüphanesi, Excel dosyalarından veri almak ve o veriler üzerinde işlemler yapmak için birçok fonksiyon sağlar.
Excel dosyalarından veri çekmek için read_excel() fonksiyonu kullanılır. Bu fonksiyonun parametreleri arasında Excel dosyasının konumu, sayfa adı ve verilerin hangi sütunlardan okunacağı gibi bilgiler yer alır. Veriler okunduktan sonra, pandas'ın head() fonksiyonu kullanılarak okunan verilerin doğru bir şekilde yüklendiği kontrol edilebilir.
Okunan veriler, pandas'ın DataFrame yapısı içerisinde saklanır. Bu veri yapısı üzerinde çeşitli filtreleme, sıralama ve gruplama işlemleri yapılabilir. Veriler üzerinde yapılan işlemler sonrasında, yeni bir Excel dosyasına ya da CSV dosyasına aktarmak için pandas'ın to_excel() veya to_csv() fonksiyonları kullanılabilir.
Veri aktarma işlemi sırasında, Excel dosyalarının yapısı, veri tipleri ve dosyanın boyutu gibi unsurlar da dikkate alınmalıdır. Özellikle büyük boyutlu Excel dosyalarından veri aktarma işlemi yaparken, bellek kullanımı ve hız açısından daha efektif yöntemler tercih edilebilir. Bu noktada, pandas kütüphanesi içinde yer alan optimize edilmiş fonksiyonlar ve veri tipi dönüşümleri kullanılarak veri aktarma işlemleri daha hızlı ve verimli hale getirilebilir.
Excel Dosyasından Verilerin Okunması
Excel dosyalarından veri aktarma işlemi yapmak için, pandas kütüphanesinde yer alan read_excel() fonksiyonu kullanılır. Bu fonksiyon, Excel dosyalarındaki verileri okuyarak bir veri çerçevesi oluşturur. Fonksiyon, birçok parametre alarak veri okuma işlemini farklı şekillerde yapılandırabilir. Bunlar arasında, okunacak sayfaların belirtilmesi, hangi satırlardan başlayacağı vb. yer alır.
read_excel() fonksiyonunun başlıca parametreleri şunlardır:
- io: Okunacak dosyanın adı, URL'si veya dosya benzeri bir nesne.
- sheet_name: Okunacak sayfanın adı veya sayfa numarası. Varsayılan olarak, ilk sayfa okunur.
- header: Sütun başlıklarının hangi satırdan başlayacağını belirtir. Varsayılan olarak, ilk satırı kullanır.
- index_col: Index sütununun adı veya sırası.
- use_cols: Okunacak sütunların listesi veya sütunların sayısal sırası.
read_excel() fonksiyonu, istenen parametrelerle birlikte çağrılarak veriler kolayca okunabilir. Bunun için, öncelikle pandas kütüphanesi import edilmeli ve read_excel() fonksiyonu çağrılmalıdır.
Okunan Verilerin Kontrol Edilmesi
Excel dosyalarından veri aktarımı yapmak için pandas kütüphanesi oldukça kullanışlı bir araçtır. Ancak, verilerin doğru bir şekilde yüklendiğinden emin olmak için okunan veriler kontrol edilmelidir. Bunun için pandas'ın head() fonksiyonu kullanılabilir. Bu fonksiyon sayesinde, yüklenen verilerin baş kısmı, varsayılan olarak 5 satırlık bir çıktı olarak görüntülenir. Eğer daha fazla satır görmek isterseniz, fonksiyona parametre olarak satır sayısı vermeniz yeterli olacaktır.
Kod | Açıklama |
---|---|
import pandas as pd | Pandas kütüphanesi yüklenir |
df = pd.read_excel("ornek.xlsx") | Excel dosyasından veriler okunur ve "df" değişkenine atılır |
print(df.head()) | Okunan verilerin baş kısmı ekrana bastırılır |
print(df.head(10)) | Okunan ilk 10 satır ekrana bastırılır |
Böylece, okunan verilerin baş kısmı kontrol edilerek, verilerin excel dosyasından doğru bir şekilde okunup okunmadığı kontrol edilebilir.
Verilerin İşlenmesi
Okunan verilerin işlenmesi, veri analizindeki en önemli adımlardan biridir. Veri işleme işlemi, pandas kütüphanesinde birçok yöntem ve fonksiyon ile gerçekleştirilir. Bu yöntemlerle veriler düzenlenebilir, eksik veriler tamamlanabilir, yeni sütunlar ve satırlar eklenip kaldırılabilir.
Örneğin, bir veri setindeki sütunların bazıları gereksiz olabilir. Bu sütunlar pandas kütüphanesi kullanılarak kolayca kaldırılabilir. Bunun için drop() fonksiyonu kullanılır. Ayrıca, eksik verileri tamamlamak için fillna() fonksiyonu kullanılabilir.
Bunların yanı sıra, pandas kütüphanesinde birçok filtreleme, gruplama, birleştirme ve toplama fonksiyonu da bulunmaktadır. Bu fonksiyonlar sayesinde veriler daha anlamlı hale getirilebilir, trendler belirlenebilir ve hatalar tespit edilebilir.
Verilerin işlenmesi, pandalar kütüphanesi tarafından desteklenen diğer birçok işlemle birlikte yapılabilmektedir. Bunun için farklı fonksiyonların ve yöntemlerin kullanımına hakim olmak gereklidir. Böylece, veriler istenilen şekilde düzenlenebilir ve analiz edilebilir.
Verilerin Veri Çerçevesine Yüklenmesi
Excel dosyalarından okunan veriler pandas kütüphanesi içinde DataFrame yapısı içine yüklenir. Pandas DataFrame, verilerin daha kolay bir şekilde manipüle edilmesine olanak tanır. Excel dosyasından okunan veriler, bir satır ve sütun yapısı olarak saklanır, ve bu verileri DataFrame yapısına yüklemek oldukça kolaydır.
read_excel() fonksiyonu ile belirtilen Excel dosyasından verilerin okunması ve pandas DataFrame yapıda saklanması mümkündür. İki adımda veri, DataFrame yapıya yüklenir: önce Excel dosyasındaki veriler okunur ve sonra bunlar pandas DataFrame yapısı içerisine yüklenir.
Bunun için aşağıdaki kod kullanılabilir:
import pandas as pddf = pd.read_excel("excel_dosya_adi.xlsx")
Bu kod ile, "excel_dosya_adi.xlsx" adlı Excel dosyasındaki veriler DataFrame yapısına yüklenir.
Ayrıca, yüklenen verilerin doğru bir şekilde yüklendiğinden emin olmak isteyebilirsiniz. Bunun için pandas'ın head() fonksiyonu kullanılabilir:
df.head()
Bu fonksiyon, yüklenen ilk 5 satırı gösterir. Eğer daha fazla satır görmek istiyorsanız, head() fonksiyonuna göstermek istediğiniz satır sayısını argüman olarak verebilirsiniz:
df.head(10)
Böylece, ilk 10 satır DataFrame yapısı içinde görüntülenir.
Veri Dışa Aktarma
Pandas kütüphanesi, sadece veri okuma ve işleme için değil, aynı zamanda verileri dışa aktarma işlemleri için de oldukça kullanışlıdır. Pandas ile verileri Excel dosyalarına yazdırmak veya CSV dosyalarına aktarmak oldukça basittir.
Pandas'ın to_excel() fonksiyonu, verileri Excel dosyasına yazdırmak için kullanılır. Bu işlem için, kaydetmek istediğiniz Excel dosyasının adını ve verinin kaydedileceği sayfanın adını belirtmeniz gerekiyor. Ayrıca, verilerin kaydedileceği sütunun ve satırın adlarını da belirtebilirsiniz. Örneğin;
Kodu | Açıklaması |
---|---|
dframe.to_excel('veriler.xlsx', sheet_name='Sheet1') | Veriler, 'veriler.xlsx' adlı Excel dosyasının 'Sheet1' adlı sayfasına yazdırılır. |
Verilerin CSV dosyasına yazdırılması işlemi, to_excel() fonksiyonu gibi to_csv() fonksiyonu ile gerçekleştirilir. Bu fonksiyon, kaydetmek istediğiniz CSV dosyanızın adını ve verilerin kaydedileceği sütunların adlarını belirtmenizi gerektirir. Örneğin;
Kodu | Açıklaması |
---|---|
dframe.to_csv('veriler.csv', sep='\t') | Veriler, 'veriler.csv' adlı CSV dosyasına '\t' ayraçı kullanılarak yazdırılır. |
Bu işlemle birlikte, pandas ile Excel dosyalarından veri aktarma ve dışa aktarma işlemlerini kolayca gerçekleştirmeniz mümkün.
Verilerin Excel Dosyasına Yazdırılması
Verilerin Excel dosyasına yazdırılması, verilerin analiz edilmesi ve işlenmesinden sonra yapılabilir. Bu işlem için pandas kütüphanesinin to_excel() fonksiyonu kullanılır.
Fonksiyonun kullanımı oldukça kolaydır. Yapmanız gereken tek şey, verilerin yazdırılacağı Excel dosyasının adını ve klasör yolunu belirlemek ve ardından to_excel() fonksiyonunu kullanarak verileri Excel dosyasına yazdırmaktır.
Bunun için, aşağıdaki örneği kullanabilirsiniz:
Kod |
---|
df.to_excel('veriler.xlsx', index=False) |
Yukarıdaki örnek kodda, 'veriler.xlsx' dosya adı olarak belirlenmiştir. Bu değiştirilebilir ve Excel dosyasının adı ve yolunun belirtilmesi gerekmektedir. Ayrıca, 'index=False' parametresi de kullanılmaktadır. Bu parametre, Excel dosyasına yazdırılmak istenmeyen index sütununun belirtilmesini engeller.
Bu şekilde, verilerinizi kolayca Excel dosyasına yazdırabilir ve daha sonraki işlemleriniz için saklayabilirsiniz.
Verilerin CSV Dosyasına Yazdırılması
Verilerin CSV dosyasına yazdırılması, pandas kütüphanesi kullanılarak oldukça kolay bir şekilde yapılabilir. CSV dosyası, virgülle ayrılmış değerler dosyası olarak bilinir ve genellikle büyük boyutlu verilerin saklandığı bir dosya formatıdır.
Verilerin CSV dosyasına yazdırılması için, pandas'ın to_csv() fonksiyonu kullanılır. Bu fonksiyon, DataFrame'deki verileri CSV dosyasına yazdırır. Fonksiyonun kullanımı oldukça basittir; sadece hangi dosyaya yazdırmak istediğiniz ve dosya adının nasıl olacağı belirtilir. Ayrıca, CSV dosyasının ayraca hangi karakteri kullanacağı da belirlenebilir. Varsayılan olarak, pandas virgülle ayrılmış bir dosya kullanır.
Verileri bir CSV dosyasına yazdırmadan önce, verilerin doğru bir şekilde işlenip yüklendiğinden emin olmak için, pandas'ın head() fonksiyonu kullanılabilir. Bu fonksiyon, DataFrame'deki ilk beş veriyi gösterir. Ayrıca, to_csv() fonksiyonunu kullanmadan önce verilerin düzenlenmesi de gerekebilir.
Parametre | Açıklama |
---|---|
path_or_buf | CSV dosyasının dosya adı veya hedef dosyaya yazılmak istenen yol. |
sep | Değerleri ayırmak için kullanılacak ayracı belirler. Varsayılan olarak, virgül kullanılır. |
index | True veya False değeri kabul eder. Eğer True olarak ayarlanırsa, DataFrame'deki indeks de CSV dosyasına yazdırılır. |
header | True veya False değeri kabul eder. Eğer True olarak ayarlanırsa, DataFrame'in sütun adları da CSV dosyasına yazdırılır. |
Örnek olarak, bir DataFrame'den verileri bir CSV dosyasına yazdırabiliriz:
df.to_csv('ornek.csv', sep=',', index=False)