Definição
O Reconhecimento de Entidades Nomeadas (NER) é uma tarefa de PNL que identifica e classifica entidades em texto, como pessoas, organizações, locais, datas ou produtos.
Propósito
O objetivo é estruturar texto não estruturado extraindo entidades-chave. Ele oferece suporte a pesquisa, extração de informações e construção de gráficos de conhecimento.
Importância
- Fundamental para recuperação de informações e pipelines de PNL.
- Erros se propagam para aplicativos posteriores.
- NER específico de domínio (por exemplo, médico, jurídico) requer conjuntos de dados personalizados.
- Relacionado a tarefas como vinculação de entidades e extração de relações.
Como Funciona
- Coletar e pré-processar texto.
- Anotar conjuntos de dados com categorias de entidade.
- Treine modelos em exemplos rotulados (CRFs, transformadores).
- Preveja entidades em texto não visto.
- Valide a precisão com dados de teste.
Exemplos (mundo real)
- spaCy: biblioteca NLP de código aberto com NER integrado.
- Stanford CoreNLP: fornece ferramentas de reconhecimento de entidades nomeadas.
- PNL financeira: extrai nomes de empresas de relatórios.
Referências/Leituras Adicionais
- Jurafsky & Martin. Processamento de Fala e Linguagem. Stanford.
- Lample et al. “Arquiteturas Neurais para Reconhecimento de Entidades Nomeadas”. ACL.
- Transformadores de rosto abraçando modelos NER.
- O que é Reconhecimento de Entidade Nomeada (NER)