YAPAY SİNİR AĞLARINA GİRİŞ
1.3. Akıl ve Zeka’nın Karşılaştırılması
30
1.4.1. Yapay Zeka’nın Alt Dalları
33
1.4.1.1. Makine Öğrenmesi
34
1.4.1.2. Yapay Sinir Ağları
34
1.4.1.3. Derin Öğrenme
35
1.4.1.4. Doğal Dil İşleme
35
1.4.1.5. Bilgisayarla Görme
36
1.4.1.7. Bulanık Mantık
36
1.4.1.8. Uzman Sistemler
37
1.4.1.9. Genetik Algoritma
38
1.4.2. Yapay Zekanın Özellikleri
38
1.4.2.1. Öğrenme Yeteneği
39
1.4.2.2. Uyarlanabilirlik
39
1.4.2.3. Veri İşleme ve Analiz Yeteneği
39
1.4.2.4. Karar Verme Kabiliyeti
39
1.4.2.5. Doğal Dil İşleme
39
1.4.2.6. Tahmin ve Öngörü Yeteneği
40
1.4.2.7. Otonom (Özerk) Çalışabilme
40
1.4.2.9. Hız ve Verimlilik
40
1.4.2.10. Mantık Yürütme
40
1.4.2.11. Paralel İşlem Yapabilme
41
1.4.2.12. Genelleme Yeteneği
41
1.4.2.13. Örüntü Tanıma
41
1.4.2.14. Belirsizlikle Başa Çıkabilme
41
1.4.2.15. Sürekli İyileşme
41
1.4.3. Yapay Zeka Uygulamaları: Alanlar ve Örnekler
41
1.4.3.1. Doğal Dil İşleme ve Çeviri Sistemleri
41
1.4.3.2. Görüntü İşleme ve Bilgisayarla Görme
42
1.4.3.3. Tavsiye Sistemleri
43
1.4.3.4. Oyun ve Eğlence Sektöründe Yapay Zeka
43
1.4.3.5. Otonom Araç Teknolojileri
44
1.4.3.6. Robotik Uygulamalar
44
1.4.3.7. Endüstriyel Otomasyon
45
1.4.3.8. Finansal Teknolojiler ve Dolandırıcılık Tespiti
45
1.4.3.9. Sağlık ve İlaç Sektörü
45
1.4.3.10. Eğitim Uygulamaları
46
1.4.3.11. Karar Destek Sistemleri
47
1.4.3.12. Güvenlik Uygulamaları
47
1.4.3.13. Görsel Sanat ve Yaratıcı Uygulamalar
48
1.4.3.14. Biyoinformatik Uygulamaları
48
YAPAY SİNİR AĞLARININ TEMELLERİ
2. YAPAY SİNİR AĞLARININ TEMELLERİ
53
2.1. Yapay Sinir Ağlarına Giriş
53
2.1.1. Yapay Sinir Ağlarının Tarihçesi
55
19. ve 20. Yüzyılın Başları: Biyolojik Mekanizmaların Keşfi
55
1943: İlk Yapay Sinir Ağ Modeli – McCulloch ve Pitts'in Çalışmaları
55
1948–1949: Wiener ve Hebb'in Çalışmaları
55
1950'ler: IBM Çalışmaları ve Rosenblatt'ın Algılayıcısı
56
1959: Widrow ve Hoff'un ADALINE ve MADALINE Modelleri
56
1969: Algılayıcının Sınırlamaları ve XOR Problemi
56
1980'ler: Hopfield, Kohonen, Rumelhart ve Hinton'in Katkıları
56
2000'ler ve Sonrası: Derin Öğrenme Dönemi
57
Günümüz ve Gelecek Vizyonu
58
2.2. İnsan Beyni ve Biyolojik Bir Sinirin Yapısı
58
2.2.1. Biyolojik Bir Sinirin Yapısı
60
2.3. Bir Yapay Sinirin Ana Öğeleri
62
2.3.4. Etkinlik İşlevi
63
2.3.4.1. İkili Basamak Etkinlik İşlevi
64
2. Üstünlükler ve Eksiklikler
65
2.3.4.2. Doğrusal Etkinlik İşlevi
66
2. Üstünlükler ve Eksiklikler
67
2.3.4.3. Sigmoid İşlevi
68
2. Üstünlükler ve Eksiklikler
69
2.3.4.4. Hiperbolik Tanjant (Tanh) İşlevi
70
2. Üstünlükler ve Eksiklikler
72
2.3.4.5. Düzeltmeli Doğrusal Birim–ReLU İşlevi
73
2. Üstünlükler ve Eksiklikler
75
2.3.4.6. Softmax İşlevi
76
2. Üstünlükler ve Eksiklikler
77
2.3.4.7. SoftPlus işlevi
78
2. Üstünlükler ve Eksiklikler
81
2.3.4.8. Etkinlik İşlevinin Seçim Ölçütleri
81
3. Performans Ölçütleri
82
2.3.4.9. Farklı Etkinlik İşlevlerinin Performans Değerlendirmesi
83
2.3.5. Ölçekleme ve Sınırlama
85
2.3.5.3. Ölçekleme ve Sınırlamanın Birlikte Kullanımı
86
2.3.5.4. Yapay Sinir Ağlarında Ölçekleme ve Sınırlamanın Uygulama Alanları
87
2.3.7.1. Öğrenme Kuralının Kavranması
89
2.4. Algılayıcı (Perceptron)
90
2.4.1. Turing Makinesi ve Algılayıcı
90
2.5. Bir Yapay Sinir Ağı
93
2.5.1. Dağıtılmış Bellek
94
2.5.2. Birleştirilmiş Bellek
95
2.5.3. Sayısal Bilgisayarlar ve Yapay Sinir Ağlarının Karşılaştırılması
95
2.6. Çok Katmanlı Bir Yapay Sinir Ağı
96
2.6.2. Sinirler ve Katmanlar Arası Bağlantılar
98
2.6.2.1. Tam Bağlantılı (Fully Connected / Dense)
98
2.6.2.2. Evrişimli (Convolutional)
98
2.6.2.3. Tekrarlayan (Recurrent)
98
2.6.2.4. Atlamalı Bağlantı (Skip Connection / Residual Connection)
99
2.6.2.5. Birleştirme (Pooling / Subsampling)
99
2.7. Öğrenme Uygulama Örnekleri
99
2.7.1. Delta Öğrenme Kuralı
99
2.7.1.1. Delta Kuralı Kullanılarak Yapılan Bir Örnek
103
2.7.2. Pekiştirmeli Öğrenme
109
2.7.2.1. Pekiştirmeli Öğrenme Kullanılarak Yapılan Bir Örnek
110
2.7.2.3. Sınırlamalar ve Uygulamalar
112
2.8. Yapay Sinir Ağlarının Üstünlükleri ve Eksiklikleri
115
YAPAY SİNİR AĞLARININ MİMARİ YAPILARI
3. YAPAY SİNİR AĞLARININ MİMARİ YAPILARI
119
3.1. Geri Yayılım Ağı
119
3.1.1. Geri Yayılım Ağı'nın Çalışma Prensibi
121
3.1.2. Matematiksel Model
123
3.1.3. Geri Yayılım Kuralı Kullanılarak Yapılan Bir Örnek
124
3.1.4. Geri Yayılım Algoritması
130
3.1.5. Geri Yayılım Etkinlik (Aktarım) İşlevleri
131
3.1.10. Geri Yayılım Ağı'nın Üstünlükleri ve Eksiklikleri
134
3.2.1. Çalışma Prensibi
136
3.2.2. Matematiksel Model
136
3.2.2.1. Ağırlık Matrisi
136
3.2.2.2. Enerji Fonksiyonu
137
3.2.2.3. Etkinlik Güncelleme Kuralı
137
3.2.3. Hopfield Ağı ile Örüntü Tanıma Uygulama Örneği
138
3.2.3.1. Adım 1: Örüntülerin Tanımlanması
138
3.2.3.2. Adım 2: Ağırlık Matrisinin Hesaplanması
138
3.2.3.3. Adım 3: Ağa Yeni Girdi Sağlanması
139
3.2.4. Hopfield Sinir Ağı’nın Üstünlükleri ve Eksiklikleri
139
3.3. Boltzman Makinesi
140
3.3.1. Çalışma Prensibi
141
3.3.2. Matematiksel Model
141
3.3.2.1. Enerji Fonksiyonu
141
3.3.2.2. Olasılık Dağılımı
142
3.3.2.3. Öğrenme ve Güncelleme
142
3.3.3. Boltzmann Makinesi ile Örnek Bir Uygulama
143
3.3.3.1. Film Tavsiyesi
143
3.3.3.2. Boltzmann Makinesi ile Çözüm
143
1. Verilerin Hazırlanması
143
5. Test ve Performans Analizi
144
3.3.4. Boltzmann Makinesi’nin Üstünlükleri ve Eksiklikleri
144
3.4. Özörgütlemeli Harita Ağı
145
3.4.2. Özörgütlemeli Haritanın Algoritması
148
3.4.3. Özörgütlemeli Harita Örneği
150
3.4.4. Özörgütlemeli Haritanın Eğitim Aşaması
150
3.4.5. Özörgütlemeli Haritanın Çağırma Aşaması
154
3.4.6. Özörgütlemeli Harita Ağı Örnek Uygulaması: Müşteri Segmentasyonu
155
3.4.7. Özörgütlemeli Harita Ağı’nın Üstünlükleri ve Eksiklikleri
157
4.1. Makine Öğrenmesinin süreç Adımları
163
4.1.3.1. Makine Öğrenmesinde Eğitim İle İlgili Kavramlar
166
Token ve Değişken Arasındaki Farklar
171
4.1.3.2. Eğitim Sonucu Verinin Öğrenilmesi
172
Yetersiz Öğrenmenin Nedenleri
174
Yetersiz Öğrenmenin Sonuçları
175
Yetersiz Öğrenmenin Önlenmesi İçin Stratejiler
175
Aşırı Öğrenmenin Nedenleri
177
Aşırı Öğrenmenin Belirtileri
178
Aşırı Öğrenmenin Etkileri
178
4.1.4.1. Aşırı Öğrenmenin Tespit Yöntemleri
179
4.1.4.2. Aşırı Öğrenmeyi Önleme Yöntemleri
179
4.1.4.1. Değerlendirme Teknikleri
180
4.2. Makine Öğrenmesi Modelleri ve Eğitim Türleri
180
4.3. Gözetimli Öğrenme
181
4.3.1.1. Doğrusal Regresyon
183
3. Matematiksel Model
185
5. Üstünlükler ve Eksiklikler
187
4.3.1.2. Çokterimli Regresyon
188
3. Matematiksel Model
190
5. Üstünlükler ve Eksiklikler
191
4.3.1.3. Lasso Regresyon
192
3. Matematiksel Model
193
5. Üstünlükler ve Eksiklikler
194
4.3.1.4. Destek Vektör Regresyonu
196
3. Matematiksel Model
197
5. Üstünlükler ve Eksiklikler
198
4.3.1.5. Karar Ağaçları Regresyonu
199
3. Matematiksel Model
201
5. Üstünlükler ve Eksiklikler
202
4.3.1.6. Değişim Artırma Regresyonu
203
3. Matematiksel Model
204
5. Üstünlükler ve Eksiklikler
205
4.3.2.1. Lojistik Regresyon
206
3. Matematiksel Model
209
5. Üstünlükler ve Eksiklikler
210
4.3.2.2. k–En Yakın Komşular
211
3. Matematiksel Model
214
5. Üstünlükler ve Eksiklikler
214
3. Matematiksel Model
216
5. Üstünlükler ve Eksiklikler
217
4.3.2.4. Destek Vektör Makineleri
219
3. Matematiksel Model
224
5. Üstünlükler ve Eksiklikler
225
4.3.2.5. Karar Ağaçları
226
3. Matematiksel Model
228
5. Üstünlükler ve Eksiklikler
229
4.3.2.6. Değişim Artırma
230
3. Matematiksel Model
232
5. Üstünlükler ve Eksiklikler
233
Popüler Gradient Boosting Kütüphaneleri
234
4.4. Gözetimsiz Öğrenme
234
4.4.1.1. k–Means Kümeleme
236
3. Matematiksel Model
237
5. Üstünlükler ve Eksiklikler
238
4.4.1.2. Gaussian Karışım Modelleri
239
3. Matematiksel Model
241
5. Üstünlükler ve Eksiklikler
242
4.4.1.3. Hiyerarşik kümeleme
243
3. Matematiksel Model
245
5. Üstünlükler ve Eksiklikler
246
4.4.1.4. Gürültülü Uygulamaların Yoğunluk Tabanlı Mekansal Kümelenmesi
247
3. Matematiksel Model
248
5. Üstünlükler ve Eksiklikler
249
4.4.2. Boyut İndirgeme
250
4.4.2.1. Temel Bileşen Analizi
250
3. Matematiksel Model
251
5. Üstünlükler ve Eksiklikler
253
4.4.2.2. t–Dağıtılmış Stokastik Komşu Gömme
254
3. Matematiksel Model
255
5. Üstünlükler ve Eksiklikler
256
4.4.2.3. Doğrusal Ayrım Analizi
257
3. Matematiksel Model
258
5. Üstünlükler ve Eksiklikler
259
4.4.2.4. Bağımsız Bileşen Analizi
260
3. Matematiksel Model
261
5. Üstünlükler ve Eksiklikler
262
4.4.2.5. Düzgün Çokkatlı Yaklaşım ve Projeksiyon
264
3. Matematiksel Model
265
5. Üstünlükler ve Eksiklikler
266
4.5. Pekiştirmeli Öğrenme
267
4.5.1. Modelden Bağımsız Yöntemler
268
3. Matematiksel Model
270
5. Üstünlükler ve Eksiklikler
271
3. Matematiksel Model
274
5. Üstünlükler ve Eksiklikler
275
4.5.2. Model Temelli Yöntemler
276
4.5.2.1. Derin Deterministik Politika Gradyanı
276
3. Matematiksel Model
277
5. Üstünlükler ve Eksiklikler
278
4.5.2.2. Yakınsal Politika Optimizasyonu
279
3. Matematiksel Model
280
5. Üstünlükler ve Eksiklikler
281
4.6. Topluluk Öğrenmesi
282
3. Matematiksel Model
284
5. Üstünlükler ve Eksiklikler
285
4.6.1.1. Bagging Örneği Rastgele Orman
286
3. Matematiksel Model
289
5. Üstünlükler ve Eksiklikler
289
3. Matematiksel Model
292
5. Üstünlükler ve Eksiklikler
293
4.6.3. Stacking Yöntemi
294
3. Matematiksel Model
295
5. Üstünlükler ve Eksiklikler
296
5.1. Derin Sinir Ağ Mimarileri ve Kullanım Alanları
303
5.2. Sayısal Görüntü İşleme
305
5.2.1. Analog Görüntü
306
5.2.2. Sayısal Görüntü
306
5.2.2.1. Siyah–Beyaz Görüntü
308
5.2.2.2. Gri Seviyeli Görüntü
308
5.2.2.3. Renkli Görüntü
308
5.3. Derin Ağlarda Kullanılan Veri Kümeleri
309
5.3.1. Görsel Veriler (Resim ve Video Kümeleri) İçin
309
5.3.1.2. CIFAR–10 / CIFAR–100
309
5.3.1.4. COCO (Common Objects in Context)
310
5.3.2. Metinsel Veriler (Doğal Dil İşleme Kümeleri) İçin
311
5.3.2.1. IMDB Review Dataset
311
5.3.2.3. SQuAD (Stanford Question Answering Dataset)
311
5.3.2.4. GLUE ve SuperGLUE
311
5.3.3. Ses (Audio) ve Konuşma Verileri İçin
312
5.3.3.3. Common Voice
312
5.3.4. Çoklu Modalite Kümeleri (Görsel + Metin, Görsel + Ses vb.) İçin
313
5.3.4.1. VQA (Visual Question Answering)
313
5.3.4.2. LRS (Lip Reading Sentences)
313
5.3.5. Özel Uygulama Alanları İçin
313
5.3.5.2. Medical Decathlon
314
5.3.5.3. LFW (Labeled Faces in the Wild)
314
5.3.5.4. Kaggle ve Özelleşmiş Kümeler
314
5.3.6. Veri Kümesi Seçim Kriterleri
314
5.4. Derin Öğrenme Kütüphaneleri
315
5.4.1. Temel Derin Öğrenme Kütüphaneleri
315
5.4.2. Özelleşmiş Kütüphaneler
316
5.4.2.1. Hugging Face Transformers
316
5.4.3. Yüksek Performans ve Araştırma Odaklı Kütüphaneler
318
5.4.4. Model Dağıtımı ve Optimizasyon
319
5.4.4.1. ONNX (Open Neural Network Exchange)
319
5.4.5. Bulut ve Platform Entegrasyonları
319
5.4.5.1. Amazon SageMaker
319
5.4.5.2. Google Colab
320
5.4.5.3. Azure Machine Learning
320
5.4.6. Özel Donanım ve Accelerator Desteği
320
5.4.6.1. CUDA ve cuDNN
320
5.4.6.2. TPU (Tensor Processing Unit)
320
5.4.7. Kütüphane Seçim Kriterleri
321
5.4.7.1. Yeni Başlayanlar İçin
321
5.4.7.2. Araştırmacılar İçin
321
5.4.7.3. Prodüksiyon İçin
321
5.5. Derin Ağlarda kullanılan Programlama Dilleri
321
5.5.7. Dil Seçimi Tavsiyesi
325
6. EVRİŞİMLİ SİNİR AĞLARI
329
6.2. Bir Boyutlu Görüntülerde Evrişim İşlemi
329
6.3. Üç Boyutlu Görüntülerde Evrişim İşlemi
333
6.3.1. Evrişim İşleminin Görüntülere Etkisi
335
6.4. Havuzlama (Pooling)
337
6.4.1. Evrişim ve Havuzlama Hesaplamaları
340
6.4.1.1. İlk Evrişim Katmanının Boyutlarının Hesaplanması
340
6.4.1.2. Evrişim Katmanının Boyutlarının Hesaplanması
341
6.4.1.3. Havuzlama Katmanının Boyutlarının Hesaplanması
342
6.5. Etkinlik İşlevleri
343
6.6. Katman ve Bağlantılar
345
6.7. Evrişimli Sinir Ağının Eğitimi
346
6.8. Düzenlileştirme (Regularization)
346
6.10. Yapay Sinir Ağları İle Karakter Algılama
348
6.11. Evrişimli Sinir Ağları İle Karakter Algılama
350
EVRİŞİMLİ SİNİR AĞ MİMARİLERİ
7. EVRİŞİMLİ SİNİR AĞ MİMARİLERİ
355
7.6. Microsoft ResNet
366
7.7. Kapsül Ağları (Capsule Network)
369
7.8. Üretken Çekişmeli Ağlar
377
8. OTOKODLAYICI AĞLARI
381
8.1. Yığınlanmış Otokodlayıcı
383
8.2. Yığınlanmış Gürültülü Otokodlayıcı
383
8.3. Otokodlayıcının Eğitimi
384
8.4. Otokodlayıcı Ağlarının oluşturulması
386
8.5. Evrişimli Otokodlayıcı Ağları
387
9. TEKRARLAYAN SİNİR AĞLARI
393
9.1. Tekrarlayan Sinir Ağlarının Uygulama Alanları
393
9.2. Tekrarlayan Sinir Ağları Nasıl Çalışır?
394
9.3. Tekrarlayan Sinir Ağ Mimarileri
398
9.3.1. Uzun Kısa Dönemli Bellek Ağları
398
9.3.2. Kapılı Tekrarlayan Birimler
400
9.4. Tekrarlayan ve Evrişimli Sinir Ağlarının Birleşimi
402
10. ÜRETKEN YAPAY ZEKA
407
10.1. Dönüştürücü Temelli Mimariler
407
10.2. Dönüştürücü Temelli Mimarilerin Üstünlükleri ve Eksiklikleri
408
10.3. Otokodlayıcı Temelli Üretken Yapay Zeka Modelleri
409
10.3.1. Değişken Otokodlayıcılar
409
10.3.1.1. Mimari Yapı
409
10.3.1.2. Çalışma Prensibi
410
10.3.1.3. Matematiksel Model
411
10.3.1.4. Üstünlükler ve Eksiklikler
411
10.3.2. Çekişmeli Otokodlayıcılar
412
10.3.2.1. Mimari Yapısı
412
10.3.2.2. Çalışma Prensibi
413
10.3.2.3. Matematiksel Model
413
10.3.2.4. Üstünlükler ve Eksiklikler
414
10.3.3. Gürültü Giderici Otokodlayıcılar
415
10.3.3.1. Mimari Yapı
415
10.3.3.2. Çalışma Prensibi
416
10.3.3.3. Matematiksel Model
416
10.3.3.4. Üstünlükler ve Eksiklikler
417
10.4. Yayılım Temelli Mimariler
418
10.4.1. Çalışma Prensipleri
418
10.4.2. Yayılım Temelli Mimarilerin Üstünlükleri ve Eksiklikleri
418
10.5. Üretken Çekişmeli Ağlar
419
10.5.1. ÜÇA'ların Temel Yapısı ve Çalışma Prensibi
420
10.5.1.1. Üretken Çekişmeli Ağ Türleri
420
Temel ÜÇA'ın Çalışma Prensibi
422
2. Derin Evrişimli Üretken Çekişmeli Ağ
423
DEÜÇA’ın Üstünlükleri ve Eksiklikleri
426
Koşullu ÜÇA'ın Üstünlükleri ve Kullanım Alanları
429
Çevrimsel ÜÇA’ın Üstünlükleri ve Eksiklikleri
432
5. Aşamalı Büyüyen ÜÇA
432
Aşamalı Büyüyen ÜÇA’ın Üstünlükleri ve Eksiklikleri
434
6. Süper Çözünürlüklü ÜÇA
435
Süper Çözünürlüklü ÜÇA’ın Üstünlükleri ve Eksiklikleri
438
10.6. Büyük Dil Modelleri
438
10.6.1. OpenAI Modeller
438
10.6.1.2. GPT–2 (2019)
439
10.6.1.3. GPT–3 (2020)
440
10.6.1.4. GPT–4o (2024)
441
10.6.1.5. GPT 4.5 (2025)
442
OpenAI Modellerinin Üstünlükleri ve Eksiklikleri
443
10.6.2. Google Modelleri
443
10.6.2.1. BERT (Bidirectional Encoder Representations from Transformers) – 2018
444
10.6.2.2. T5 (Text–to–Text Transfer Transformer) – 2019
445
10.6.2.3. Gemini – 2023
446
Google Modellerinin Üstünlükleri ve Eksiklikleri
446
10.6.2.4. Karşılaştırmalı Analiz ve Sonuç
446
10.6.3. Meta LLaMA Modelleri
447
10.6.3.1. Teknolojik Temeller
447
10.6.3.2. Mimari Yapı
448
10.6.3.3. Eğitim Süreçleri ve Veri Setleri
448
10.6.3.4. Model Versiyonları ve Teknik Özellikler
448
Meta Modellerinin Üstünlükleri ve Eksiklikleri
449
10.6.4. Anthropic Claude Modelleri
449
10.6.4.1. Teknolojik Temeller
450
10.6.4.2. Dil Modeli Yapısı
450
10.6.4.3. Mimari ve Optimizasyon
450
10.6.4.4. Eğitim Yöntemleri
450
10.6.4.5. Değişkenler ve Token Kapasitesi
451
10.6.4.6. Açık Kaynak Durumu
451
Claude modellerinin Üstünlükleri ve Eksiklikleri
451
10.6.5. Microsoft Copilot
451
10.6.5.1. Teknolojik Altyapı ve Temel Dil Modeli
452
10.6.5.2. Mimari Yapı ve GPT–4 Entegrasyonu
452
10.6.5.3. Eğitim Yöntemleri ve Veri Kaynakları
452
10.6.5.4. Değişken ve Token Boyutları
452
10.6.5.5. Açık Kaynak Durumu
453
Copilot’un Üstünlükleri ve Eksiklikleri
453
10.6.6.1. DeepThink V3
454
Teknoloji ve Dil Modeli
454
Değişkenler ve Token Kapasitesi
454
10.6.6.2. DeepThink R1 Modeli
454
Teknoloji ve Dil Modeli
454
Değişkenler ve Token Kapasitesi
455
10.6.6.3. Açık Kaynak Durumu
455
10.6.6.4. Kullanım Alanları ve Performans
455
DeepSeek’in Üstünlükleri ve Eksiklikleri
455
10.6.7.1. Teknolojik Temeller
456
10.6.7.2. Dil Modeli Yapısı
457
10.6.7.3. Mimari Yapı
457
10.6.7.4. Eğitim Süreci ve Veri Kaynakları
457
10.6.7.5. Değişken ve Token Kapasitesi
457
10.6.7.6. Açık Kaynak Durumu
458
Grok’un Üstünlükleri ve Eksiklikleri
458