Uma Rede Neural Convolucional (CNN) é um tipo de algoritmo de aprendizado profundo projetado para processar dados de grade estruturada, como imagens. Ele consiste em múltiplas camadas, incluindo camadas convolucionais, camadas de pooling e camadas totalmente conectadas, que trabalham juntas para aprender de forma automática e adaptativa hierarquias espaciais de recursos a partir de dados de entrada.
CNNs são usadas principalmente para reconhecimento, classificação e processamento de imagens e vídeos. Eles são eficazes nessas tarefas porque podem detectar automaticamente recursos importantes sem exigir extração manual de recursos. Isso torna as CNNs valiosas para aplicações como detecção de objetos, reconhecimento facial e análise de imagens médicas.
Sim, CNN significa Rede Neural Convolucional. Seu nome vem da operação de convolução que é um componente central de sua arquitetura, que auxilia na extração de recursos dos dados de entrada por meio de uma série de transformações.
Em uma CNN, uma convolução é uma operação em que um filtro (ou kernel) é aplicado a uma matriz de dados de entrada (como uma imagem) para produzir um mapa de características. Este processo envolve deslizar o filtro pela entrada e calcular o produto escalar entre o filtro e partes dos dados de entrada. As convoluções ajudam a capturar padrões locais e hierarquias espaciais nos dados.
Uma CNN funciona passo a passo da seguinte forma: Primeiro, a imagem de entrada passa por uma série de camadas convolucionais onde os filtros extraem características. Em seguida, as camadas de pooling reduzem as dimensões espaciais dos mapas de características, mantendo características importantes e reduzindo a complexidade computacional. Este processo de convolução e agrupamento pode ser repetido várias vezes. Finalmente, os mapas de características de saída são achatados e passados por camadas totalmente conectadas para produzir a classificação ou previsão final.