Matplotlib ve Seaborn ile Veri Görselleştirme

Matplotlib ve Seaborn, Python’da veri görselleştirme için kullanılan iki güçlü kütüphanedir. Bu kütüphaneler, verileri daha anlaşılır hale getirmek ve analiz sonuçlarını görsel olarak sunmak için grafikler oluşturmanıza olanak tanır.

1. Matplotlib ile Veri Görselleştirme

Matplotlib, temel grafikler oluşturmak için kullanılan esnek ve güçlü bir kütüphanedir. Çizgi grafikler, çubuk grafikler, histogramlar ve daha birçok grafik türü oluşturmak için kullanılır.

a. Basit Çizgi Grafiği

Örnek:
import matplotlib.pyplot as plt

# X ve Y verilerini tanımlama
x = [1, 2, 3, 4, 5]
y = [1, 4, 9, 16, 25]

# Çizgi grafiği oluşturma
plt.plot(x, y, label="Çizgi", color="blue", marker="o")
plt.xlabel("X Ekseni")
plt.ylabel("Y Ekseni")
plt.title("Basit Çizgi Grafiği")
plt.legend()
plt.grid(True)
plt.show()

 

Bu örnekte, plt.plot() fonksiyonu kullanılarak basit bir çizgi grafiği oluşturulmuştur. Grafiğin eksen etiketleri, başlığı, grid çizgileri ve gösterge etiketi (legend) eklenmiştir.

b. Çubuk Grafiği (Bar Chart)

Örnek:
# Çubuk grafiği verileri
categories = ["A", "B", "C", "D"]
values = [3, 7, 5, 12]

# Çubuk grafiği oluşturma
plt.bar(categories, values, color="green")
plt.xlabel("Kategoriler")
plt.ylabel("Değerler")
plt.title("Basit Çubuk Grafiği")
plt.show()

Çubuk grafikler, kategorik verilerin görselleştirilmesi için kullanılır. plt.bar() fonksiyonu, kategoriler ve karşılık gelen değerlerle bir çubuk grafiği oluşturur.

c. Histogram

Histogramlar, sürekli verilerin dağılımını göstermek için kullanılır.

Örnek:
import numpy as np

# Rastgele veri üretimi
data = np.random.randn(1000)

# Histogram oluşturma
plt.hist(data, bins=30, color="purple", edgecolor="black")
plt.xlabel("Değerler")
plt.ylabel("Frekans")
plt.title("Veri Dağılımı Histogramı")
plt.show()

Bu örnekte, np.random.randn() fonksiyonu kullanılarak rastgele veriler oluşturulmuş ve bu verilerin dağılımı bir histogramla gösterilmiştir.

d. Dağılım Grafiği (Scatter Plot)

Dağılım grafikleri, iki değişken arasındaki ilişkiyi görselleştirmek için kullanılır.

Örnek:
# Rastgele veri üretimi
x = np.random.rand(50)
y = np.random.rand(50)

# Dağılım grafiği oluşturma
plt.scatter(x, y, color="red", marker="x")
plt.xlabel("X Değerleri")
plt.ylabel("Y Değerleri")
plt.title("Basit Dağılım Grafiği")
plt.show()

Bu örnekte, plt.scatter() fonksiyonu kullanılarak iki değişken arasındaki ilişkiyi gösteren bir dağılım grafiği oluşturulmuştur.

e. Alt Grafikler (Subplots)

Matplotlib, birden fazla grafiği aynı figürde yan yana veya alt alta yerleştirmenize olanak tanır.

Örnek:
# Alt grafik oluşturma
plt.figure(figsize=(10, 4))

# İlk grafik
plt.subplot(1, 2, 1)
plt.plot(x, y, "r-")
plt.title("Çizgi Grafiği")

# İkinci grafik
plt.subplot(1, 2, 2)
plt.scatter(x, y)
plt.title("Dağılım Grafiği")

plt.tight_layout()
plt.show()

Bu örnekte, plt.subplot() fonksiyonu kullanılarak iki farklı grafik, tek bir figürde yan yana yerleştirilmiştir.

2. Seaborn ile Veri Görselleştirme

Seaborn, Matplotlib üzerine inşa edilmiş daha gelişmiş ve estetik görselleştirmeler sağlayan bir kütüphanedir. Seaborn, özellikle istatistiksel grafikler ve veri keşfi için kullanışlıdır.

a. Dağılım Grafiği (Scatter Plot) – Seaborn

Seaborn, Matplotlib’e göre daha estetik ve detaylı dağılım grafikleri sunar.

Örnek:
import seaborn as sns

# Seaborn ile dağılım grafiği
tips = sns.load_dataset("tips")
sns.scatterplot(x="total_bill", y="tip", data=tips, hue="smoker", style="time")
plt.title("Seaborn Dağılım Grafiği")
plt.show()

Bu örnekte, Seaborn’un scatterplot() fonksiyonu kullanılarak, tips veri seti üzerinde bir dağılım grafiği oluşturulmuştur. hue ve style parametreleri ile farklı gruplar arasındaki farklar görselleştirilmiştir.

b. Çubuk Grafiği (Bar Plot)

Seaborn, kategorik veriler için çubuk grafikler oluşturmada da güçlüdür.

Örnek:
# Seaborn ile çubuk grafiği
sns.barplot(x="day", y="total_bill", data=tips, hue="sex")
plt.title("Seaborn Çubuk Grafiği")
plt.show()

Bu örnekte, Seaborn’un barplot() fonksiyonu kullanılarak, tips veri setindeki günlere göre toplam hesap miktarı gösterilmiştir. hue parametresi, cinsiyete göre farklı gruplar arasında ayrım yapar.

c. Histogram ve Yoğunluk Grafiği (Distribution Plot)

Seaborn, verilerin dağılımını hem histogram hem de yoğunluk grafiği ile görselleştirmeyi sağlar.

Örnek:
# Seaborn ile dağılım grafiği
sns.histplot(tips["total_bill"], kde=True, color="blue")
plt.title("Seaborn Histogram ve Yoğunluk Grafiği")
plt.show()

Bu örnekte, Seaborn’un histplot() fonksiyonu kullanılarak bir histogram ve yoğunluk grafiği (KDE) aynı anda çizilmiştir.

d. Kutu Grafiği (Box Plot)

Kutu grafikleri, verilerin dağılımını ve istatistiksel özetini görselleştirmek için kullanılır.

Örnek:
# Seaborn ile kutu grafiği
sns.boxplot(x="day", y="total_bill", data=tips, hue="smoker")
plt.title("Seaborn Kutu Grafiği")
plt.show()

Bu örnekte, Seaborn’un boxplot() fonksiyonu kullanılarak, tips veri setinde günlere göre hesapların dağılımı ve istatistiksel özetleri kutu grafiği ile gösterilmiştir.

e. Isı Haritası (Heatmap)

Isı haritaları, verilerin yoğunluğunu veya korelasyonları görselleştirmek için kullanılır.

Örnek:
# Korelasyon matrisi oluşturma
corr = tips.corr()

# Seaborn ile ısı haritası
sns.heatmap(corr, annot=True, cmap="coolwarm")
plt.title("Seaborn Isı Haritası")
plt.show()

Bu örnekte, tips veri setindeki sayısal değişkenler arasındaki korelasyonları görselleştiren bir ısı haritası oluşturulmuştur. annot=True ile her hücredeki korelasyon katsayısı gösterilmiştir.

f. Çift Grafikler (Pair Plot)

Çift grafikler, bir veri setindeki her değişken çiftini bir dağılım grafiği ile karşılaştırır ve aynı zamanda dağılım grafikleri çizer.

Örnek:
# Seaborn ile çift grafikler
sns.pairplot(tips, hue="smoker")
plt.show()

Bu örnekte, pairplot() fonksiyonu kullanılarak tips veri setindeki tüm sayısal değişkenler arasındaki ilişkiler görselleştirilmiştir.

3. Matplotlib ve Seaborn Karşılaştırması

  • Esneklik: Matplotlib, grafiklerin her yönünü özelleştirmek için daha fazla esneklik sunar.
  • Kullanım Kolaylığı: Seaborn, istatistiksel grafikler için daha basit bir sözdizimi ve daha estetik varsayılan ayarlar sunar.
  • Estetik: Seaborn, varsayılan olarak daha estetik grafikler sunar, bu da veri keşfi ve sunumu için idealdir.
  • Özelleştirme: Matplotlib, daha düşük seviyede detaylı özelleştirme gerektiren projelerde tercih edilebilir.

Matplotlib ve Seaborn, Python‘da veri görselleştirme için temel araçlardır. Matplotlib, temel grafiklerin yanı sıra detaylı özelleştirme seçenekleri sunarken, Seaborn estetik ve istatistiksel görselleştirmelerde güçlüdür. Veri analizinde hem Matplotlib hem de Seaborn kullanarak, verilerinizi etkili bir şekilde görselleştirebilir ve analiz sonuçlarınızı daha anlaşılır bir şekilde sunabilirsiniz.

Comments

“Matplotlib ve Seaborn ile Veri Görselleştirme” için bir yanıt

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Bu site, istenmeyenleri azaltmak için Akismet kullanıyor. Yorum verilerinizin nasıl işlendiği hakkında daha fazla bilgi edinin.