- 22 Nis 2022
- 1,744
- 1,365
Merhaba, ben Phobos. Forumda veri bilimi ile ilgili bir eğitim serisi oluşturmak istedim.
Veri bilimi son dönemlerde büyük ilgi çekiyor. Matematiğin, yazılımın, istatistiğin ve daha birçok alanın da bu bilimde çokça karşımıza çıkması hoşuma gitti. Birçok alan hakkında yeterli bilgiye sahip olmayı gerektirmesi sebebiyle zor fakat çalışarak başarılı olabileceğiniz bir bilim.
Bu konumda fazla detaya girmedim. Başlangıç eğitimi olacağı için bazı işlemleri uzun yoldan anlattım.
İyi okumalar...
Not: Bu kodları çalıştırabilmeniz için IPYNB dosyalarını kullanmalısınız. Bu bağlantıdan JupyterLab veya Jupyter Notebook kurulum adımlarına ulaşabilirsiniz. Ben Visual Studio Code' da kullanıyorum ama bu yöntem ile daha kolay bir şekilde kurulumu gerçekleştirebilirsiniz. Daha sonra kurulumunu da anlatabilirim fakat şu anlık bu bilgi size yeterli gelir.
Veri bilimi son dönemlerde büyük ilgi çekiyor. Matematiğin, yazılımın, istatistiğin ve daha birçok alanın da bu bilimde çokça karşımıza çıkması hoşuma gitti. Birçok alan hakkında yeterli bilgiye sahip olmayı gerektirmesi sebebiyle zor fakat çalışarak başarılı olabileceğiniz bir bilim.
Bu konumda fazla detaya girmedim. Başlangıç eğitimi olacağı için bazı işlemleri uzun yoldan anlattım.
İyi okumalar...
import pandas as pd | Pandas kütüphanesini eklememizi sağlar. |
data = pd.read_csv('data.csv') | CSV dosyasını okumamızı sağlar. |
data.head() | Verimizin ilk 5 satırını ekrana yansıtır. |
data.tail() | Verimizin son 5 satırını ekrana yansıtır. |
data.shape | (A,B) olarak ekrana yansır. A=Satır B=Sütun |
data.iloc[X] | X. satırdaki verileri ekrana yansıtır. |
data.iloc[0:5] | 0. satırdan 5. satıra kadarki (5 dâhil değil) verileri ekrana yansıtır. |
data.iloc[-5:0] | Son 5 satırdaki verileri ekrana yansıtır. |
data[data['X'] == 'Y'] | X sütununda bulunan Y değerlerinin bulunduğu satırdaki verileri ekrana yansıtır. |
data[data['X'] == 'Y'].head() | X sütununda bulunan Y değerlerinin bulunduğu ilk 5 satırdaki verileri ekrana yansıtır. |
data['X'].replace('Y', 'Z') | X sütununda bulunan Y değerlerinin ismini Z olarak değiştirir. |
data['X'].replace(['Y', 'A'],['Z', 'B']) | X sütununda bulunan Y değerlerinin ismini Z, A değerlerinin ismini B olarak değiştirir. |
data['X'] = data['X'].replace(['Y', 'A'],['Z', 'B']) | Bir önceki adımda yaptığımız işlemi dataya kaydeder ve datada kalıcı değişiklik yapılmış olur. |
data.rename(columns={'N':'M', 'K':'L'}) | N sütununun ismini M, K sütununun ismini L olarak değiştirir. |
data['X'].min() | X sütununda bulunan en küçük değeri ekrana yansıtır. |
data['X'].max() | X sütununda bulunan en büyük değeri ekrana yansıtır. |
data['X'].mean() | X sütununda bulunan verilerin değerlerinin ortalamasını ekrana yansıtır. |
data['X'].sum() | X sütununda bulunan verilerin değerlerinin toplamını ekrana yansıtır. |
data['X'].count() | X sütununda bulunan değer sayısını ekrana yansıtır. |
data['X'].unique() | X sütununda bulunan değer çeşitliliğini ve veri türünü ekrana yansıtır. |
data['X'].value_counts() | Yukarıdaki işleme ek olarak bu değerlerin miktarını da ekrana yansıtır. |
data.isnull() | Verilerin değer alıp almadığını kontrol eder. False=Değer Var True=Değer Yok |
data.isnull().sum() | Sütunlardaki değer almayan verilerin miktarını ekrana yansıtır. |
![nt3kzhp.jpg](https://i.hizliresim.com/nt3kzhp.jpg)
Eleştirilerinizi ve yorumlarınızı belirtirseniz, kendimi daha da geliştirmeme yardımcı olacağınız için sevinirim.
İyi günler ve iyi forumlar...