Makine Öğrenmesi: Terminoloji

Hatice Özbolat
4 min readAug 28, 2023

Makine öğrenmesine ilk adım attığınızda, bazen bootcamp programları, Udemy kursları veya YouTube eğitimleri gibi kaynaklardan başlayarak, öğrenim sürecinin başında kullanılan özel terimler nedeniyle makine öğrenmesinden kaynaklı bir endişe hissedebilirsiniz. Bu endişeler, eğitimin zorluğundan veya eğitmenlerin kullandığı özel dil ve kavramlardan kaynaklanmaz. Makine öğrenmesi, veri analizi, istatistik, matematik, yapay zeka ve derin öğrenme gibi birçok farklı alana dayandığı için, terimlerin anlamını kavramak bazen karmaşıklaşabilir.

Giphy

Bu durumu daha iyi anlamanız ve oluşan ön yargıları azaltmanız için, makine öğrenmesindeki en temel 50 terimi incelemek faydalı olabilir. İşte bu yazıda, bu terimleri anlaşılır bir şekilde açıklamaya çalışacağım.

İlk olarak makine öğrenmesinin tanımı ile başlayım.

Makine Öğrenmesi (Machine Learning): Bilgisayar sistemlerinin verilerden öğrenerek performanslarını geliştirebildiği bir yapay zeka dalı.

Model İnşası ve Değerlendirme:

  1. Yapay Zeka (Artificial Intelligence): Bilgisayar sistemlerinin insan benzeri zeka görevlerini gerçekleştirmek üzere tasarlandığı alan.
  2. Veri (Data): Makine öğrenmesinin temelini oluşturan girdiler. Veriler, öğrenme algoritmalarının eğitildiği ve test edildiği bilgileri içerir.
  3. Etiket (Label): Gözetimli öğrenme yöntemlerinde, her veri örneğine karşılık gelen doğru çıktı veya hedef değer.
  4. Eğitim Verileri (Training Data): Makine öğrenme modelinin eğitimini gerçekleştirmek için kullanılan veri örnekleri.
  5. Test Verileri (Test Data): Eğitilen modelin gerçek dünya performansını değerlendirmek için kullanılan ayrı bir veri seti.
  6. Özellikler (Features): Veri örneklerini tanımlayan öz nitelikler veya karakteristikler.
  7. Model: Makine öğrenme algoritması tarafından öğrenilen ve veri üzerinde tahminler yapabilen yapay yapı.
  8. Algoritma (Algorithm): Belirli bir görevi gerçekleştirmek veya belirli bir probleme çözüm üretmek için kullanılan yöntem veya prosedür.
  9. Veri Önişleme (Data Preprocessing): Veri setinin düzeltilmesi, temizlenmesi ve özelliklerin uygun bir şekilde düzenlenmesi işlemi.
  10. Model Eğitimi (Model Training): Bir makine öğrenme modelinin eğitim verileri üzerinde öğrenme sürecini ifade eder.
  11. Model Değerlendirmesi (Model Evaluation): Eğitilmiş bir modelin performansını test verileri üzerinde değerlendirme süreci.
  12. Aşırı Uyum (Overfitting): Modelin eğitim verilerine aşırı uyum sağlayarak genellemeyi kaybetmesi durumu.
  13. Eğitim-Test Ayrımı (Train-Test Split): Veri setinin eğitim ve test verileri olarak ikiye ayrılması işlemi.
  14. Hiperparametreler (Hyperparameters): Makine öğrenme algoritmalarının performansını etkileyen, genellikle el ile ayarlanması gereken parametreler.
  15. Doğrulama Kümesi (Validation Set): Model hiperparametrelerinin ayarlanması ve seçilmesi için kullanılan ayrı bir veri seti.
  16. Sınıflandırma (Classification): Veri noktalarını farklı sınıflara atayan bir tür görev.
  17. Regresyon (Regression): Bir çıktıyı sürekli bir değere haritalayan bir tür görev.
  18. Doğruluk (Accuracy): Bir sınıflandırma modelinin doğru tahminlerin toplam veri sayısına oranı.
  19. Hata Oranı (Error Rate): Bir sınıflandırma modelinin yanlış tahminlerin toplam veri sayısına oranı.
  20. Eğitim Algoritması (Training Algorithm): Modelin eğitim verilerini kullanarak öğrenmeyi gerçekleştiren matematiksel süreç.
  21. Epoch: Bir eğitim algoritmasının tüm eğitim verilerini tamamladığı tek bir döngü.
  22. Batch: Eğitim verilerinin küçük gruplar halinde bölünmesi; her biri için ağırlık güncellemesi yapılır.
  23. Ağ (Network): Yapay sinir ağı (neural network), verileri işlemek ve öğrenmek için düğümlerden oluşan bir yapıdır.
  24. Derin Öğrenme (Deep Learning): Yapay sinir ağlarının derin ve karmaşık yapılarla kullanıldığı öğrenme yöntemi.
  25. Duyarlılık ve Özgüllük (Sensitivity and Specificity): Sınıflandırma modelinin gerçek pozitif ve gerçek negatif oranlarını ifade eder.
  26. F1 Skoru (F1 Score): Duyarlılık ve kesinlik (precision) değerlerinin harmonik ortalaması, sınıflandırma modellerinin performansını ölçer.
  27. Aktivasyon Fonksiyonları (Activation Functions): Yapay sinir ağlarında her bir düğümün çıktısını hesaplamak için kullanılan matematiksel fonksiyonlar.
  28. Kayıp Fonksiyonu (Loss Function): Modelin tahminlerinin gerçek değerlerden ne kadar uzak olduğunu ölçen fonksiyon.
  29. Toplama Katmanı (Summation Layer): Yapay sinir ağındaki girdilerin ağırlıklı toplamlarını hesaplayan katman.
  30. Ağırlık (Weight): Yapay sinir ağındaki bağlantıların güçlerini ifade eden parametreler.
  31. Eğitim Hızı (Learning Rate): Gradient Descent algoritmasında ağırlık güncellemelerinin ne kadar büyük adımlarla yapılacağını belirleyen parametre.
  32. Epoch Sayısı (Number of Epochs): Eğitim algoritmasının veriyi kaç kez döngüden geçeceğini belirleyen parametre.
  33. Dropout: Aşırı uyumu azaltmak için yapay sinir ağındaki rastgele düğüm bağlantılarını kapatma tekniği.
  34. Gradient Vanishing/Exploding: Derin ağlarda gradientlerin çok küçük veya çok büyük değerlere sahip olması sorunu.
  35. Regularizasyon: Aşırı uyumu azaltmak için modelin ağırlıklarını düzenleyen teknikler.
  36. Öğrenme (Learning): Modelin veriye dayalı deneyim yoluyla performansını geliştirmesi süreci.
Algoritma Gıphy

Algoritmalar ve Yöntemler:

  1. Gradient Descent: Bir optimizasyon algoritmasıdır ve modelin hiperparametrelerini ayarlamak için kullanılır.
  2. Gözetimli Öğrenme (Supervised Learning): Etiketli verileri kullanarak girdi ve çıktı arasındaki ilişkiyi öğrenen bir öğrenme türü.
  3. Gözetimsiz Öğrenme (Unsupervised Learning): Etiket olmadan veri örneklerinin gizli yapılarını bulmaya çalışan bir öğrenme türü.
  4. Takviyeli Öğrenme (Reinforcement Learning): Bir ajanın çevresiyle etkileşime girerek ödülleri maksimize etmeye çalıştığı bir öğrenme türü.
  5. Transfer Öğrenme (Transfer Learning): Bir görevde öğrenilen modelin, farklı bir görevde kullanılması yöntemi.
  6. Karar Ağaçları (Decision Trees): Sınıflandırma veya regresyon görevleri için ağaç yapısıyla kullanılan bir model türü.
  7. Destek Vektör Makineleri (Support Vector Machines, SVM): Sınıflandırma ve regresyon problemleri için kullanılan öğrenme yöntemi.
  8. Kümelenme (Clustering): Verileri benzer özelliklere göre gruplandırma işlemi.
  9. Boyut Azaltma (Dimensionality Reduction): Özellik sayısını azaltarak veriyi daha anlaşılır hale getirme işlemi.
  10. PCA (Principal Component Analysis): Boyut azaltma yöntemi olarak kullanılan istatistiksel bir teknik.
  11. Veri Augmentasyonu (Data Augmentation): Eğitim verilerini çeşitlendirme amacıyla veriye rastgele dönüşümler uygulama işlemi.
  12. Veri Normalleştirme (Data Normalization): Verileri belirli bir aralığa ölçeklendirme işlemi, modelin daha iyi öğrenmesine yardımcı olabilir.
  13. Konvolüsyonel Sinir Ağları (Convolutional Neural Networks, CNN): Görüntü işleme gibi görevlerde kullanılan özel bir yapay sinir ağı türü.
  14. Naive Bayes: Sınıflandırma problemlerinde yaygın olarak kullanılan bir olasılık tabanlı algoritma. Bayes teoremini kullanarak, verilerin sınıflara atanma olasılıklarını tahmin eder.

Makine öğrenmesi dünyasına adım atıyorsanız, yukarıda yer alan terimler ve algoritmalar, temel anlayışınızı geliştirmenize yardımcı olacak başlangıç seviye kavramlarını içerir. Bu terimler, geniş ve dinamik bir alanda sadece bir başlangıç noktasıdır. Pratik yaparak, bu terimleri daha derinlemesine keşfedebilir ve öğrenme yolculuğunuzu geliştirebilirsiniz.

Sophia

Yazımı buraya kadar okuduysan ve benzeri içerikler paylaşmamı istiyorsan beğenmeyi ve yorum bırakmayı unutmayın ✨😍

--

--