Konwolucyjna sieć neuronowa (CNN) to rodzaj algorytmu głębokiego uczenia się przeznaczonego do przetwarzania ustrukturyzowanych danych siatkowych, takich jak obrazy. Składa się z wielu warstw, w tym warstw splotowych, warstw łączenia i warstw w pełni połączonych, które współpracują, aby automatycznie i adaptacyjnie uczyć się przestrzennych hierarchii obiektów na podstawie danych wejściowych.
Sieci CNN służą głównie do rozpoznawania, klasyfikacji i przetwarzania obrazów i wideo. Są skuteczne w tych zadaniach, ponieważ mogą automatycznie wykrywać ważne funkcje bez konieczności ręcznego wyodrębniania cech. To sprawia, że CNN są cenne w zastosowaniach takich jak wykrywanie obiektów, rozpoznawanie twarzy i analiza obrazów medycznych.
Tak, CNN oznacza konwolucyjną sieć neuronową. Jej nazwa pochodzi od operacji splotu, która jest podstawowym składnikiem jego architektury, która pomaga w wydobywaniu cech z danych wejściowych poprzez serię transformacji.
W CNN splot to operacja, podczas której filtr (lub jądro) jest stosowany do macierzy danych wejściowych (takiej jak obraz) w celu utworzenia mapy obiektów. Proces ten polega na przesuwaniu filtra po wejściu i obliczaniu iloczynu skalarnego pomiędzy filtrem a fragmentami danych wejściowych. Sploty pomagają w przechwytywaniu lokalnych wzorców i hierarchii przestrzennych w danych.
CNN działa krok po kroku w następujący sposób: Najpierw obraz wejściowy przechodzi przez szereg warstw splotowych, w których filtry wyodrębniają cechy. Następnie warstwy łączące zmniejszają wymiary przestrzenne map obiektów, zachowując ważne funkcje, jednocześnie zmniejszając złożoność obliczeniową. Ten proces splotu i łączenia można powtarzać wielokrotnie. Na koniec wyjściowe mapy obiektów są spłaszczane i przepuszczane przez w pełni połączone warstwy w celu uzyskania ostatecznej klasyfikacji lub prognozy.