NumPy ve Pandas Kullanarak Veri Setlerini Birleştirme ve Dosyalama

NumPy ve Pandas Kullanarak Veri Setlerini Birleştirme ve Dosyalama

NumPy ve Pandas kullanarak veri setlerini birleştirme ve dosyalama işlemleri hakkında her şey bu yazıda! Birbirinden farklı veri setlerinizi kolaylıkla birleştirip analiz edebileceğiniz bu yöntemlerle veri işleme işlemleriniz daha etkili bir hale gelecek Hemen okuyun ve veri işleme alanındaki bilginizi artırın!

NumPy ve Pandas Kullanarak Veri Setlerini Birleştirme ve Dosyalama

Python programlama dili, geliştiricilere çok sayıda kütüphane sunmaktadır. Bu kütüphaneler, veri setlerinin işlenmesini ve analizini kolaylaştırmak üzere tasarlanmıştır. NumPy ve Pandas, Python'da veri analizi yapmak için yaygın olarak kullanılan iki ana kütüphanedir. Veri setlerini birleştirmek ve dosyalamak için de kullanılırlar.

NumPy ve Pandas, Python programcılarına farklı veri türleriyle çalışma imkanı sunar. NumPy, özellikle matris hesaplamaları için uygundur. Öte yandan, Pandas, düz veri tabloları ve zaman serileri gibi yapılandırılmış verilerin işlenmesinde kullanılır.

Bu makalede, NumPy ve Pandas kütüphaneleri kullanılarak veri setlerinin birleştirilmesi ve dosyalanması işlemleri hakkında bilgi verilecek. Ayrıca Pandas kütüphanesi kullanarak inner join ve outer join işlemleri hakkında da detaylı bilgi alacaksınız. Dosyalama işlemleri hakkında da bilgi sahibi olacaksınız. Csv ve Excel dosyaları gibi farklı dosya biçimlerinde verileri kaydetmek ve yüklemek için Pandas kütüphanesini kullanarak yapabileceğiniz farklı işlemler anlatılacaktır.


NumPy Kullanarak Veri Setlerini Birleştirme

NumPy, Python dilinde kullanılan bir kütüphanedir ve veri kütlelerinin sayılarla ifade edilmesi ve manipüle edilmesi için kullanılır. Veri setlerini birleştirme işlemleri de NumPy kütüphanesi ile yapılabilir. Bu işlemler, iki farklı dizi içindeki verileri birleştirerek tek bir dizi oluşturur.

Bu işlem için kullanılan yöntemler şunlardır:

  • concatenate()
  • stack()
  • hstack()
  • vstack()

Örnek olarak, iki farklı dizi içindeki verileri concatenate() yöntemi ile birleştirerek bir dizi oluşturabilirsiniz. Bu yöntemi kullanarak, veri setlerini herhangi bir boyutta birleştirebilirsiniz.

```pythonimport numpy as np

dizi1 = np.array([1,2,3])dizi2 = np.array([4,5,6])

birlesik_dizi = np.concatenate((dizi1, dizi2))

print(birlesik_dizi)```

Bu kod bloğu, dizi1 ve dizi2 içindeki verileri birleştirerek, birbirine ekler ve birlesik_dizi adında yeni bir dizi oluşturur. Bu dizi, [1, 2, 3, 4, 5, 6] şeklinde olacaktır.

NumPy kütüphanesi ile yapabilecekleriniz işlemler bununla da sınırlı değil. Özellikle büyük boyutlu veri kümeleri için hızlı ve verimli bir işlem yürütmek gerekiyorsa NumPy kütüphanesi kullanımı oldukça avantajlıdır.


Pandas Kullanarak Veri Setlerini Birleştirme

Python programlama dili, geliştirdiği kütüphaneler sayesinde veri analizi işlemleri için oldukça kullanışlı bir platforma dönüşmüştür. Pandas kütüphanesi de bu platformda oldukça sık kullanılan bir kütüphanedir. Pandas kütüphanesi, veri setleri üzerinde işlemler yapmaya olanak sağlar. Bu işlemler arasında veri birleştirme de bulunmaktadır.

Pandas kütüphanesi sayesinde veri birleştirme işlemi oldukça kolay bir hale gelmektedir. Bu işlem için kullanılabilecek iki farklı fonksiyon mevcuttur. Bunlardan ilki "merge" fonksiyonudur. "Merge" fonksiyonu, farklı veri setlerini birleştirerek tek bir veri seti oluşturmak için kullanılır. Diğeri ise "concat" fonksiyonudur. "Concat" fonksiyonu, farklı veri setlerini birleştirerek tek bir veri seti elde etmek yerine, mevcut veri setinin alt veya yanına veri setlerini eklemek için kullanılır.

"Merge" fonksiyonu, başlıca birleştirme işlemleri arasında "inner join" ve "outer join" işlemlerini barındırır. "Inner join" işlemi, farklı veri setlerinin ortak olan index veya sütunlarını birleştirerek yeni bir veri seti oluşturur. "Outer join" ise farklı veri setlerini herhangi bir ortak özelliği olmaksızın birleştirerek yeni bir veri seti oluşturur.

Her iki fonksiyonun kullanımı da oldukça basittir. İki farklı veri seti olduğunda, "merge" fonksiyonu kullanılarak bu veri setleri birleştirilebilir. Bunun için öncelikle iki veri setinde de ortak olan bir sütun veya index belirlenir. Daha sonra bu ortak özellik kullanılarak "merge" fonksiyonu çağrılır. Aynı şekilde, "concat" fonksiyonu da kullanılarak farklı veri setleri birleştirilebilir.

Veri birleştirme işlemi sayesinde, farklı kaynaklarda olan veriler tek bir veri seti üzerinde işlenebilir hale gelir. Bu sayede, verilerin analizi ve yönetimi de oldukça kolaylaşır.


Inner Join İşlemi

Pandas kütüphanesi kullanarak veri setleri birleştirme yöntemlerinden biri de "inner join" işlemidir. Inner join, iki veri setinde ortak olan verileri bir araya getirir. Yani, sadece iki veri setindeki değerleri eşleştiren satırlar yeni bir veri setinde birleştirilir.

Birleştirme işlemi için pandas'ın merge() fonksiyonu kullanılır. Bu fonksiyon, birleştirmek istediğimiz iki farklı veri setini birlikte işlememizi sağlar. Aşağıda bir örnek ile inner join işleminin daha iyi anlaşılmasını sağlayalım:

Öğrenci Notu Bölüm
Ahmet 80 Bilgisayar Müh.
Ayşe 90 Elektrik Elektronik Müh.
Ali 70 Bilgisayar Müh.
Tuncay 95 İnşaat Müh.
Bölüm Fakülte
Bilgisayar Müh. Mühendislik Fakültesi
Elektrik Elektronik Müh. Mühendislik Fakültesi
İnşaat Müh. Mimarlık ve Tasarım Fakültesi

Yukarıdaki iki tabloyu bölüm sütunu üzerinden inner join işlemi ile birleştirelim:

import pandas as pdogrenciler = pd.DataFrame({   "Öğrenci": ["Ahmet", "Ayşe", "Ali", "Tuncay"],   "Notu": [80, 90, 70, 95],   "Bölüm": ["Bilgisayar Müh.", "Elektrik Elektronik Müh.", "Bilgisayar Müh.", "İnşaat Müh."]})bölümler = pd.DataFrame({   "Bölüm": ["Bilgisayar Müh.", "Elektrik Elektronik Müh.", "İnşaat Müh."],   "Fakülte": ["Mühendislik Fakültesi", "Mühendislik Fakültesi", "Mimarlık ve Tasarım Fakültesi"]})birlesik = pd.merge(ogrenciler, bölümler, on="Bölüm", how="inner")print(birlesik)

Bu kodları çalıştırdıktan sonra birleşik adında yeni bir veri seti oluşturulacak ve sonuç aşağıdaki gibi olacaktır:

Öğrenci Notu Bölüm Fakülte
Ahmet 80 Bilgisayar Müh. Mühendislik Fakültesi
Ayşe 90 Elektrik Elektronik Müh. Mühendislik Fakültesi
Ali 70 Bilgisayar Müh. Mühendislik Fakültesi
Tuncay 95 İnşaat Müh. Mimarlık ve Tasarım Fakültesi

Görüldüğü gibi, inner join işlemi ile sadece iki veri setindeki ortak değerler birleştirilerek yeni bir veri seti oluşturuldu. Bu yöntem, özellikle büyük veri setleri ile çalışırken verimli bir birleştirme yöntemi olarak kullanılabilir.


Örnek 1

Birleştirme işlemleri yapılırken inner join işlemi sıkça tercih edilen yöntemlerden biridir. Pandas kullanarak yapılan inner join işlemi, iki veri setini seçilmiş olan sütuna göre birleştirir. İki veri setinin de ortak sütunu kullanılarak birleştirilir ve ortak sütunlarda bulunan verilerin kesişim kümesi oluşturulur. Birleştirme işlemi gerçekleştirilmeden önce veri setleri Pandas DataFrame olarak yüklenir.

Örnek için, aşağıdaki iki farklı veri setine sahip olalım:

Adı Yaşı Şehri
Ahmet 30 Ankara
Ayşe 26 İstanbul
Adı Mesleği Şehri
Ahmet Doktor Ankara
Mehmet Mühendis İzmir

Bu iki tabloyu Adı ve Şehri sütunlarına göre birleştirelim:

  • İlk olarak, Pandas kütüphanesini içe aktarın ve iki veri setini yükleyin.
  • Kod yazarken, 'merge' fonksiyonunu kullanarak birleştirme işlemi gerçekleştirilir.
  • Birleştirme işlemini gerçekleştirdikten sonra, sonuçları görmek için 'print' fonksiyonunu kullanabilirsiniz.

Şimdi, Pandas kütüphanesi ve veri setlerimizi yükleyelim:

    import pandas as pd    # Veri setlerinin yüklenmesi  df1 = pd.DataFrame({'Adı': ['Ahmet', 'Ayşe'],                      'Yaşı': [30, 26],                      'Şehri': ['Ankara', 'İstanbul']})    df2 = pd.DataFrame({'Adı': ['Ahmet', 'Mehmet'],                      'Mesleği': ['Doktor', 'Mühendis'],                      'Şehri': ['Ankara', 'İzmir']})  

Ardından, birleştirmeyi yapalım:

    # Inner join işlemi uygulanması  inner_join = pd.merge(df1, df2, on=["Adı", "Şehri"])  print(inner_join)  

Bu kodlar ile inner join işlemi gerçekleştirilir ve aşağıdaki çıktı elde edilir:

Adı Yaşı Şehri Mesleği
Ahmet 30 Ankara Doktor

Bu örnekte, df1 ve df2 veri setleri 'Adı' ve 'Şehri' sütunlarını ortak olarak paylaştığı için inner join yöntemi kullanılmıştır. Bu sayede Ahmet'in doktor olduğu bilgisi elde edilirken, diğer veriler ise birleştirme sonrasında kaybolmuştur.


Örnek 2

Pandas inner join işleminde farklı parametreler kullanarak birleştirme işlemi gerçekleştirilebilir. Bu örnekte, "students" ve "grades" veri setleri örnek olarak kullanılacak. "students" veri setinde öğrenci numaraları ve isimleri yer almaktadır. "grades" veri setinde ise öğrenci numaraları ve aldıkları derslere ait notlar yer alır. İki veri seti içinde yer alan ortak kategori "Öğrenci Numarası"dır.

Bu örnekte, öğrencilerin aldığı dersleri ve bu derslerin notlarını birleştirmek istiyoruz. İki veri setini birleştirmek için "pd.merge()" fonksiyonu kullanılacaktır. İç birleştirme yapmak için "how" parametresine "inner" değeri verilmelidir.

students
Öğrenci Numarası Ad Soyad
1001 Ahmet Yılmaz
1002 Mehmet Öztürk
1003 Ali Demir
grades
Öğrenci Numarası Ders Kodu Dönem Not
1001 101 2019-2020 Güz 80
1002 102 2019-2020 Güz 90
1002 103 2019-2020 Güz 85
1001 102 2019-2020 Bahar 75
1003 101 2019-2020 Güz 95
1003 103 2019-2020 Bahar 80
import pandas as pdstudents = pd.DataFrame({'Öğrenci Numarası': ['1001', '1002', '1003'], 'Ad': ['Ahmet', 'Mehmet', 'Ali'], 'Soyad': ['Yılmaz', 'Öztürk', 'Demir']})grades = pd.DataFrame({'Öğrenci Numarası': ['1001', '1002', '1002', '1001', '1003', '1003'], 'Ders Kodu': ['101', '102', '103', '102', '101', '103'], 'Dönem': ['2019-2020 Güz', '2019-2020 Güz', '2019-2020 Güz', '2019-2020 Bahar', '2019-2020 Güz', '2019-2020 Bahar'], 'Not': [80, 90, 85, 75, 95, 80]})inner_join = pd.merge(students, grades, on = 'Öğrenci Numarası', how = 'inner')

Yukarıdaki kodda "pd.DataFrame()" fonksiyonu ile örnek veriler oluşturuldu. Daha sonra iki veri seti "pd.merge()" fonksiyonu ile iç birleştirme yapılarak "inner_join" değişkenine atandı. Elde edilen sonuç aşağıdaki gibi görüntülenir:

Öğrenci Numarası Ad Soyad Ders Kodu Dönem Not
1001 Ahmet Yılmaz 101 2019-2020 Güz 80
1001 Ahmet Yılmaz 102 2019-2020 Bahar 75
1002 Mehmet Öztürk 102 2019-2020 Güz 90
1002 Mehmet Öztürk 103 2019-2020 Güz 85
1003 Ali Demir 101 2019-2020 Güz 95
1003 Ali Demir 103 2019-2020 Bahar 80

Elde edilen sonuçta öğrenci numaralarına göre "students" ve "grades" veri setleri birleştirildi ve öğrencilerin aldıkları dersler ve notları görüntülendi.


Outer Join İşlemi

Pandas outer join işlemi, iki ya da daha fazla veri setini birleştirme ihtiyacını karşılamak için kullanılan bir yöntemdir. Bu işlem, merge() fonksiyonu ile gerçekleştirilir ve verileri birleştirirken kayıpların da göz önünde bulundurulmasını sağlar.

Outer join işlemi, veri setlerindeki ortak özelliklerin yanı sıra farklılıklara da dikkat eder. Bu nedenle, bir veri setinde yer alan bir kayıt diğer veri setinde olmasa bile sonuçta gösterilmektedir.

  • Sol Outer Join: Sol taraftaki veri setindeki tüm kayıtların yanı sıra ikinci veri setindeki eşleşen kayıtların da gösterilmesi.
  • Sağ Outer Join: Sağ taraftaki veri setindeki tüm kayıtların yanı sıra ilk veri setindeki eşleşen kayıtların da gösterilmesi.
  • Tam Outer Join: Her iki veri setindeki tüm kayıtların gösterilmesi.

Pandas outer join işlemi, veri analizi sürecinde oldukça faydalı olabilir. Özellikle, veri setlerindeki eksik veya farklı verilerin tamamlanması ya da birleştirilmesi gerektiği zamanlarda kullanılabilir.

Aşağıdaki örneklerde, farklı parametreler kullanarak Pandas outer join işlemi ile örnek verilerin birleştirilmesi gösterilmiştir.


Örnek 1

Bu örnekte, Pandas kütüphanesi kullanılarak outer join işlemi yaparak iki farklı veri setinin nasıl birleştirileceği anlatılacaktır.

İlk olarak, outer join işlemi hakkında kısaca bilgi verelim. Outer join işlemi, birleştirilecek iki veri setindeki tüm değerlerin korunmasını sağlar. Eğer bir veri setinde diğer veri setindeki karşılığı olmayan değerler varsa, bu değerler de birleştirilmiş veri setinde yer alır.

Örnek olarak, öğrenci bilgilerini içeren bir veri seti ile sınav notlarını içeren bir veri setinin birleştirilmesini ele alalım. İki farklı dosyadan verileri Pandas kütüphanesi vasıtasıyla yükleyerek veri ön işleme adımlarını gerçekleştirebiliriz.

```pythonimport pandas as pd

# Öğrenci bilgileri veri setini yükleyelimogrenciler_df = pd.read_csv('ogrenciler.csv')

# Sınav notları veri setini yükleyelimsinavlar_df = pd.read_csv('sinavlar.csv')```

Daha sonra, iki veri setini merge() fonksiyonuyla birleştirebiliriz. Bu örnekte, öğrenci numaralarına göre birleştirme yapacağız. Ayrıca, how='outer' parametresini kullanarak outer join işlemi yapacağımızı belirtmeliyiz.

```python# Birleştirme işlemini yapalımbirlesik_df = pd.merge(ogrenciler_df, sinavlar_df, on='ogrenci_no', how='outer')```

Son olarak, birleştirilmiş veri setini bir csv dosyasına kaydedebiliriz.

```python# Yeni veri setini csv dosyasına kaydedelimbirlesik_df.to_csv('birlesik.csv', index=False, encoding='utf-8')```

Bu örnekte, Pandas outer join işlemi nasıl yapılır öğrendik ve iki farklı veri setini nasıl birleştirebileceğimize dair örnekler gördük. Pandas kütüphanesi oldukça güçlü ve veri işleme işlemlerinin çoğunu basitleştirir.


Örnek 2

Örnek 2:Pandas kütüphanesi kullanarak outer join (tam birleştirme) işlemi, farklı parametreler kullanılarak gerçekleştirilebilir. Bu örnekte, "Satıcılar" ve "Ürünler" adlı iki farklı veri setimiz var. Şimdi bu iki veri setini outer join yöntemiyle birleştirerek firmaya ilişkin tüm veri setini elde edebiliriz.

Öncelikle, her iki veri setindeki "id" sütunlarını birleştirerek yeni bir veri seti oluşturacağız. Kodlar aşağıda yer almaktadır:

``` python import pandas as pd # Satıcılar veri seti sellers = pd.DataFrame({ 'seller_id': [101, 102, 103, 104, 105], 's_name': ['Ali', 'Veli', 'Seda', 'Can', 'Mehmet'], 'city': ['Ankara', 'İstanbul', 'İzmir', 'Kayseri', 'Bursa']}) # Ürünler veri seti products = pd.DataFrame({ 'prod_id': [201, 202, 203, 204, 205], 'p_name': ['Bilgisayar', 'Telefon', 'Televizyon', 'Tablet', 'Klavye'], 'seller_id': [104, 101, 102, 105, 103]}) # Satıcılar ve ürünler veri setlerinin outer join işlemi merged_data = pd.merge(sellers, products, on='seller_id', how='outer') print(merged_data)```

Bu kodlarla, "sellers" ve "products" veri setleri dışında, "merged_data" adlı bir veri seti oluşturduk ve "seller_id" sütununu birleştirerek outer join yöntemiyle iki veri setini birleştirdik. "on" parametresi, hangi sütundan birleştirme işleminin yapılacağını belirtmek için kullanılır. "how" parametresi, hangi tip birleştirme işleminin yapılacağını belirtmek için kullanılır. "outer" değeri, outer join işlemi yapılacağını belirtir.

Bu işlem sonucunda, satıcılar ve ürünler veri setleri birleştirilerek firmaya ilişkin tüm veri seti elde edilir. Bu veri seti, "merged_data" adlı veri setinde görünecektir.


Veri Dosyalama İşlemleri

Veri dosyalama işlemleri, Python programlama dilinde oldukça önemli bir rol oynamaktadır. Birçok veri seti farklı dosya biçimlerinde kaydedilebilir ve bu verileri farklı dosya türlerinde saklamak kolaylaştırabilir.

CSV dosya biçimi, verileri basit bir metin dosyası olarak saklamak için yaygın olarak kullanılan bir formattır. CSV dosya biçimindeki veriler, virgülle ayrılmış sütunlara sahip bir tablo olarak okunabilir ve yazılabilir. Python'da, verileri CSV dosyasında kaydetmek ve yüklemek için Pandas kütüphanesini kullanabilirsiniz.

CSV Dosya Kaydetme CSV Dosya Yükleme
df.to_csv('dosya_adi.csv', index=False) pd.read_csv('dosya_adi.csv')

Excel dosya biçimi de oldukça yaygın bir dosya biçimidir ve verilerin kolayca okunmasına ve yazılmasına olanak tanır. Ayrıca, Excel dosyalarının farklı sütunların renklerini, yazı tiplerini ve hücre biçimlendirmesini ayarlayabilirsiniz. Python'da, Pandas kütüphanesi ile Excel dosyası kaydetme ve yükleme işlemleri gerçekleştirebilirsiniz.

Excel Dosya Kaydetme Excel Dosya Yükleme
df.to_excel('dosya_adi.xlsx', index=False) pd.read_excel('dosya_adi.xlsx')

Bu dosya biçimleri ile verilerin kolayca saklanması ve kolayca ulaşılabilmesi sağlanır. Veri dosyalama işlemleri, büyük boyutlu verileri kolayca depolamanın ve sistematik bir şekilde saklamanın yollarından biridir.


Csv Dosya İşlemleri

Python programlama dili ile csv dosyaları üzerinde kaydetme ve yükleme işlemleri oldukça kolaydır. Öncelikle csv dosyası oluşturmak için pandas kütüphanesini kullanabilirsiniz. Pandas'ın read_csv() metodu ile csv dosyalarını yükleme ve to_csv() metodu ile de csv dosyalarına kaydetme işlemleri yapabilirsiniz.

Bunun yanı sıra, csv dosyaları üzerinde birçok işlem yapmak için kullanabileceğiniz başka kütüphaneler de mevcuttur. Örneğin, csv kütüphanesi ile csv dosyalarını daha düşük seviyede manipüle edebilirsiniz. Bu kütüphane ile csv dosyasındaki her satırdaki verileri ayrı şekilde ele alabilir, kaydedebilir ya da yükleyebilirsiniz.

Csv dosyaları üzerinde yapabileceğiniz işlemler arasında, verileri filtreleme, sıralama, gruba ayırma gibi birçok yöntem yer almaktadır. Verilerinizin işlenmesi için bu işlemler oldukça önemlidir ve csv dosyaları ile bu işlemleri yapmak oldukça hızlı ve kolaydır.

Metod Adı Açıklama
read_csv() Csv dosyasındaki verileri okur ve bir DataFrame nesnesi olarak döndürür
to_csv() Bir DataFrame nesnesi veya bir paneli csv dosyasına kaydeder
csv.writer() Csv dosyasına veri yazmak için kullanılır
csv.reader() Csv dosyasında yer alan verileri okumak için kullanılır

Pandas kütüphanesi ile csv dosyaları üzerinde yapabileceğiniz işlemler oldukça kolay olmakla birlikte, csv kütüphanesi ile daha fazla kontrol sağlayabilirsiniz. Kendi işlemleriniz için uygun olan kütüphaneyi seçerek, csv dosyalarınız üzerinde istediğiniz her türlü manipülasyonu gerçekleştirebilirsiniz.


Excel Dosya İşlemleri

Excel, günümüzde sıklıkla kullanılan bir ofis programıdır. Python ile Excel dosyalarını okuma, yazma ve düzenleme işlemleri için farklı kütüphaneler kullanılabilir. Pandas kütüphanesi, Python ile Excel dosyalarını yönetmek için oldukça etkili bir seçenektir.

Pandas kütüphanesi, read_excel() ve to_excel() metodları sayesinde Excel dosyaları üzerinde işlem yapmayı sağlar. read_excel() metodu, bir Excel dosyasını okumanıza olanak tanır. Dosya yolu belirtilerek, ilgili Excel dosyası okunabilir. Örneğin:

import pandas as pddf = pd.read_excel('ornek.xlsx')

Bu işlem ile ornek.xlsx adlı Excel dosyası okunur ve df adlı bir Pandas DataFrame objesi olarak kaydedilir. Excel dosyası okunduktan sonra, to_excel() metodu kullanılarak değişiklik yapılan veriler Excel dosyasına kaydedilebilir. Örneğin:

df.to_excel(r'ornek.xlsx', index = False, header=True)

Bu işlem ile df DataFrame objesi "ornek.xlsx" adlı Excel dosyasına kaydedilir. index=False parametresi, verilerin Excel dosyasına kaydedilirken indekslerin eklenmemesini sağlar. header=True parametresi, sütun başlıklarının kaydedilmesini sağlar.

Ayrıca, Excel dosyaları Pandas DataFrame objelerine dönüştürülebilir. Bu işlem için ise read_excel() metodu kullanılabilir. Dosya okunur ve DataFrame objesi olarak kaydedilir. Örneğin:

import pandas as pdexcelfile = 'ornek.xlsx'df = pd.DataFrame(pd.read_excel(excelfile))

Burada örnek.xlsx adlı Excel dosyası okunarak, pd.read_excel() metodu ile okunan dosya pd.DataFrame() ile DataFrame objesi olarak kaydedilmektedir.

Excel dosyaları ile ilgili işlemlerle birlikte, Pandas kütüphanesi ile Python'da veri setlerinin dosyalama işlemleri oldukça kolay hale gelir. Csv ve Excel dosyaları üzerinde yapılan işlemlerle birlikte, veri setleri daha kolay yönetilir ve kullanılabilir.