Een convolutionele laag in een neuraal netwerk, specifiek ontworpen voor convolutionele neurale netwerken (CNN’s), past convolutiebewerkingen toe op invoergegevens. Deze lagen bestaan uit filters (ook bekend als kernels) die over invoergegevens glijden en puntproducten berekenen tussen de filtergewichten en lokale regio’s van de invoer. De uitvoer van deze bewerkingsformulieren bevat kaarten die ruimtelijke hiërarchieën en patronen binnen de invoergegevens benadrukken. Convolutionele lagen zijn fundamenteel in CNN-architecturen en dragen bij aan hun vermogen om hiërarchische representaties van kenmerken zoals randen, texturen en vormen uit afbeeldingen en andere ruimtelijke gegevens te extraheren en te leren.
Een convolutioneel neuraal netwerk (CNN) is een type deep learning-model dat specifiek is toegesneden op het verwerken van gestructureerde rasterachtige gegevens, zoals afbeeldingen of tijdreeksgegevens. Simpel gezegd bestaat een CNN uit meerdere lagen, waaronder convolutionele lagen, poolinglagen en volledig verbonden lagen. De architectuur van het netwerk is geïnspireerd op de organisatie van de visuele cortex van dieren, waarbij gebruik wordt gemaakt van gedeelde gewichten en lokale connectiviteit om op efficiënte wijze hiërarchische kenmerken uit invoergegevens te halen. CNN’s blinken uit in taken als beeldclassificatie, objectdetectie en beeldsegmentatie vanwege hun vermogen om automatisch patronen in visuele gegevens te leren en te identificeren.
De term “convolutioneel” in convolutionele lagen komt voort uit de wiskundige bewerking van convolutie die op de invoergegevens wordt toegepast. Bij beeldverwerking houdt convolutie in dat een kleine matrix (het filter of de kernel) over het invoerbeeld wordt geschoven en het puntproduct tussen het filter en lokale delen van het beeld wordt berekend. Dit proces maakt het mogelijk om kenmerken zoals randen, texturen en patronen uit de invoergegevens te extraheren, wat de basis vormt voor volgende lagen om meer abstracte representaties te leren. Door het gebruik van convolutionele lagen in CNN’s kan het netwerk betekenisvolle kenmerken efficiënt verwerken en extraheren uit hoogdimensionale gegevens zoals afbeeldingen.
Het idee achter convolutionele neurale netwerken (CNN’s) is om de hiërarchische organisatie van het menselijke visuele systeem na te bootsen om steeds abstractere representaties van gegevens te extraheren. CNN’s maken gebruik van convolutionele lagen om filters toe te passen op invoergegevens, waardoor lokale patronen en ruimtelijke relaties worden vastgelegd. Door lagen samen te voegen worden vervolgens kenmerken samengevoegd, waardoor de ruimtelijke dimensies worden verkleind terwijl belangrijke informatie behouden blijft. Ten slotte integreren volledig verbonden lagen geëxtraheerde functies voor classificatie- of regressietaken. Deze hiërarchische functie-extractie stelt CNN’s in staat om complexe patronen rechtstreeks uit onbewerkte gegevens te leren, waardoor ze krachtige hulpmiddelen worden voor taken die begrip van ruimtelijke structuren en patronen vereisen, zoals beeldherkenning en -analyse.