Definição
Segmentação semântica é a tarefa de visão computacional de classificar cada pixel em uma imagem em uma categoria, como estrada, edifício ou pedestre.
Propósito
O objetivo é fornecer compreensão detalhada do cenário para aplicações de IA em direção autônoma, imagens médicas e robótica.
Importância
- Essencial para percepção em nível de pixel em sistemas críticos de segurança.
- Permite limites de objetos precisos em comparação com caixas delimitadoras.
- Requer grandes conjuntos de dados anotados.
- Computacionalmente intensivo em altas resoluções.
Como Funciona
- Colete e rotule imagens anotadas em nível de pixel.
- Treine modelos de aprendizado profundo como redes totalmente convolucionais.
- A imagem de entrada é processada em previsões em nível de pixel.
- A máscara de saída atribui cada pixel a uma classe.
- Avalie com métricas como Intersecção sobre União (IoU).
Exemplos (mundo real)
- Conjunto de dados de paisagens urbanas: segmentação semântica para cenas urbanas.
- Tesla Autopilot: segmentação em nível de pixel para navegação rodoviária.
- Imagem médica: segmentação de tumores em exames de ressonância magnética.
Referências/Leituras Adicionais
- Long et al. “Redes totalmente convolucionais para segmentação semântica”. CVPR 2015.
- Conjunto de dados de paisagens urbanas.
- Transações do IEEE sobre imagens médicas.