Yapay zeka için en temel ne bilinmeli ufaktan ufaktan bu konu altında paylaşıcam bu bilgiler sizi sıkabilir ama ilerleyen haftalarda projeler üretecez.Eksiklerim olucaktır elbet ama bir yararım dahi dokunursa ne mutlu bana.Anlatımlar video şeklinde olucak ve kullanılan kodlar ve açıklamaları videoların hemen altında bulunacak.Bu arada anlatımlar python3 üzerinden yapılacaktır.
[ame]https://www.youtube.com/watch?v=1n4gJIibt2g[/ame]
[ame]https://www.youtube.com/watch?v=CAljJutPIGw[/ame]
[ame]https://www.youtube.com/watch?v=1n4gJIibt2g[/ame]
[ame]https://www.youtube.com/watch?v=CAljJutPIGw[/ame]
not:İlk anlatım biraz sıkıcı olabilir bunlar ne işimize yarar diyebilirsiniz ilerleyen günlerdeki projelerde ne iş için kullanıldığını görüceksiniz.
Kod:
import numpy as np
from sklearn import preprocessing
#Bazı örnek verileri tanımlayalım:
input_data = np.array([[5.1, -2.9, 3.3],
[-1.2, 7.8, -6.1],
[3.9, 0.4, 2.1],
[7.3, -9.9, -4.5]])
#Birkaç farklı ön işleme tekniği hakkında konuşacağız.
#1:Binarization
#Bu değerler sayısal değerlerimizi boole değerlerine dönüştürmek istediğimizde kullanılır.
#Giriş verisini, eşik değeri olarak 2.1 kullanarak ikili hale getirmek için dahili bir yöntem kullanalım
# Binarize data
data_binarized = preprocessing.Binarizer(threshold=2.1).transform(input_data)
print("\nBinarized data:\n", data_binarized)
#burda 2.1 üzerindeki değerler 1 olur diğerleri ise 0 olur
#2:Mean removal
#Ortalamanın kaldırılması, makine öğrenmede kullanılan yaygın bir ön işlem tekniğidir.
#Bu özellik vektörümüzdeki özelliklerin önyargısını kaldırmak için yapıyoruz.
## ortalama ve standart sapma
print("\nBEFORE:")
print("ortalama= (4 sutün değerinin ortalaması)", input_data.mean(axis=0))
print("sıtandart sapma", input_data.std(axis=0))
#axis = 0 denildiğinde sütün dikkate alınır veya axis = 1 için yatay dikkate alınır.
#Önceki satır, giriş verilerinin ortalama ve standart sapmasını gösterir.
# Remove mean
data_scaled = preprocessing.scale(input_data)
#Burda yaptığımız ortalamyı 0 lamak
print("\nAFTER:")
print(data_scaled)
print("ortalama =", data_scaled.mean(axis=0))
print("Standart ortalama =", data_scaled.std(axis=0))
#3:Scaling
# Min max scaling
data_scaler_minmax = preprocessing.MinMaxScaler(feature_range=(0, 1))
print(data_scaler_minmax)
data_scaled_minmax = data_scaler_minmax.fit_transform(input_data)
print("\nMin max scaled data:\n", data_scaled_minmax)
#Her satır ölçeklenir, böylece maksimum değer 1 olur ve diğer tüm değerler bu değere göredir.
#4:Normalization
#Özellik vektöründeki değerleri değiştirmek için normalleştirme işlemini kullanırız
# Normalize data
data_normalized_l1 = preprocessing.normalize(input_data, norm='l1')
#l1 normalize her satırdaki mutlak değerin toplamının 1 olmasını sağlamaya çalışır
#l1 aykırı değerlere karşı dayanıklıdır bazen bazen bunu istemeyiz bu yüzden l2 kullanırız
data_normalized_l2 = preprocessing.normalize(input_data, norm='l2')
#l2 karelerin toplamının 1 olmasını sağlmaya çalışır
print("\nL1 normalized data:\n", data_normalized_l1)
print("\nL2 normalized data:\n", data_normalized_l2)
Son düzenleme: