Evrişimli sinir ağları CNN nasıl çalışır?

Evrişimli Sinir Ağları (CNN’ler), görüntüler gibi giriş verilerinin hiyerarşik temsillerini otomatik olarak öğrenmek için evrişimli katmanlardan yararlanarak çalışır. Her evrişimli katman, giriş verileri üzerinde kayan ve özellikleri çıkarmak için evrişim işlemlerini gerçekleştiren filtrelerden (çekirdek olarak da adlandırılır) oluşur. Bu özellikler kenarlar, dokular ve şekiller gibi uzamsal desenleri yakalar. Bilgi birbirini takip eden evrişimsel katmanlardan akarken ağ, giderek daha karmaşık hale gelen modelleri tespit etmeyi öğrenir. Havuzlama katmanları daha sonra özellik haritalarının uzamsal boyutlarını azaltır, önemli bilgileri korurken hesaplama verimliliğini artırır. Son olarak, tamamen bağlı katmanlar, öğrenilen özelliklere dayalı tahminler yapmak için düzleştirilmiş özellik haritalarını işler.

CNN’ler, giriş verilerine bir dizi evrişim ve havuz katmanı uygulayarak çalışır. Evrişimli katmanlar, giriş boyunca kayan küçük filtreler kullanır ve özellik haritaları oluşturmak için öğe bazında çarpma ve toplama gerçekleştirir. Bu özellik haritaları, giriş verilerindeki yerelleştirilmiş kalıpları yakalar. Havuzlama katmanları daha sonra özellik haritalarını alt örnekleyerek uzamsal boyutları azaltır ve baskın özellikleri çıkarır. Bu hiyerarşik özellik çıkarma işlemi, CNN’lerin karmaşık verilerin sağlam temsillerini öğrenmesine olanak tanıyarak onları görüntü sınıflandırma, nesne algılama ve görüntü bölümleme gibi görevlerde etkili kılar.

Derin Evrişimli Sinir Ağları (DCNN’ler), gittikçe soyutlaşan özellikleri öğrenmek için birden fazla evrişim katmanını istifleyerek CNN’lerin mimarisini genişletir. Veriler daha derin katmanlardan akarken ağ, giriş verilerindeki karmaşık ilişkileri yakalayarak özelliklerin hiyerarşik temsillerini öğrenir. DCNN’ler genellikle eğitim istikrarını ve performansını artırmak için toplu normalleştirme, ayrılma düzenlemesi ve artık bağlantılar gibi ek teknikleri içerir. Bu daha derin mimariler, DCNN’lerin görüntü tanıma ve semantik segmentasyon gibi bilgisayarla görme görevlerinde en son teknolojiye sahip sonuçlara ulaşmasını sağlar.

CNN’lerin mekanizması, giriş verilerindeki özellikleri tespit etmek için filtreler kullanan evrişimli katmanların kullanımı etrafında döner. Her filtre giriş üzerinde kayar ve kenarlar, dokular ve desenler gibi özellikleri çıkarmak için evrişim işlemleri gerçekleştirir. Ağ, hataların yinelemeli olarak en aza indirildiği geri yayılım yoluyla eğitim sırasında filtre ağırlıklarını ayarlayarak bu özellikleri tanımayı öğrenir. CNN’ler, çoklu evrişim katmanlarını doğrusal olmayan aktivasyon fonksiyonlarıyla istifleyerek, veriler içindeki karmaşık ilişkileri ve hiyerarşik temsilleri modelleyebilir, etkili öğrenme ve çıkarım sağlayabilir.

Tamamen Evrişimli Ağlar (FCN’ler), CNN mimarilerini görüntü segmentasyonu gibi uzamsal çıktı gerektiren görevler için uyarlar. Sınıflandırma için tamamen bağlantılı katmanlar kullanan geleneksel CNN’lerin aksine, FCN’ler bu katmanları evrişimli katmanlarla değiştirir. Bu değişiklik, FCN’lerin ağ boyunca uzamsal bilgileri koruyarak piksel bazında tahminler üretmesine olanak tanır. FCN’ler, havuzlama işlemleri sırasında kaybedilen uzamsal çözünürlüğü geri kazanmak için sıklıkla üst örnekleme katmanlarını veya aktarılmış evrişimleri içerir. FCN’ler, uçtan uca evrişimli işlemeyi sürdürerek, isteğe bağlı boyutlardaki giriş ve çıkışları verimli bir şekilde işleyerek, onları görüntülerde anlamsal bölümleme ve nesne algılama gibi görevler için çok uygun hale getirir.