Ein Convolutional Neural Network (CNN) ist eine Art Deep-Learning-Algorithmus, der für die Verarbeitung strukturierter Rasterdaten wie Bilder entwickelt wurde. Es besteht aus mehreren Schichten, einschließlich Faltungsschichten, Pooling-Schichten und vollständig verbundenen Schichten, die zusammenarbeiten, um automatisch und adaptiv räumliche Hierarchien von Merkmalen aus Eingabedaten zu lernen.
CNNs werden hauptsächlich zur Erkennung, Klassifizierung und Verarbeitung von Bildern und Videos verwendet. Sie sind bei diesen Aufgaben effektiv, da sie wichtige Merkmale automatisch erkennen können, ohne dass eine manuelle Merkmalsextraktion erforderlich ist. Dies macht CNNs wertvoll für Anwendungen wie Objekterkennung, Gesichtserkennung und medizinische Bildanalyse.
Ja, CNN steht für Convolutional Neural Network. Es ist nach der Faltungsoperation benannt, die eine Kernkomponente seiner Architektur darstellt und dabei hilft, Merkmale aus Eingabedaten durch eine Reihe von Transformationen zu extrahieren.
In einem CNN ist eine Faltung eine Operation, bei der ein Filter (oder Kernel) auf eine Eingabedatenmatrix (z. B. ein Bild) angewendet wird, um eine Feature-Map zu erstellen. Bei diesem Vorgang wird der Filter über die Eingabe geschoben und das Skalarprodukt zwischen dem Filter und Teilen der Eingabedaten berechnet. Faltungen helfen bei der Erfassung lokaler Muster und räumlicher Hierarchien in den Daten.
Ein CNN funktioniert Schritt für Schritt wie folgt: Zunächst wird das Eingabebild durch eine Reihe von Faltungsschichten geleitet, in denen Filter Merkmale extrahieren. Als nächstes reduzieren die Pooling-Layer die räumlichen Dimensionen der Feature-Maps, behalten wichtige Features bei und reduzieren gleichzeitig die Rechenkomplexität. Dieser Faltungs- und Pooling-Prozess kann mehrmals wiederholt werden. Schließlich werden die Ausgabe-Feature-Maps abgeflacht und durch vollständig verbundene Schichten geleitet, um die endgültige Klassifizierung oder Vorhersage zu erstellen.