Definição
A Geração Aumentada de Recuperação (RAG) é uma técnica que combina modelos generativos com sistemas de recuperação de informação. Ela baseia os resultados em fontes externas para melhorar a precisão dos fatos.
Propósito
O objetivo é reduzir alucinações em IA generativa, complementando as respostas com documentos recuperados. É especialmente útil em tarefas de resposta a perguntas e tarefas que exigem muito conhecimento.
Importância
- Melhora a precisão factual nas saídas do LLM.
- Permite a integração de conhecimento específico do domínio.
- Requer sistemas de recuperação confiáveis.
- Relacionado à pesquisa híbrida e ao controle de qualidade de domínio aberto.
Como Funciona
- O usuário fornece uma consulta ou prompt.
- O sistema de recuperação busca documentos relevantes.
- Os documentos são passados para um modelo generativo.
- O modelo gera respostas baseadas no conteúdo recuperado.
- Os ciclos de feedback melhoram o desempenho futuro.
Exemplos (mundo real)
- OpenAI ChatGPT com plugins de navegação ou recuperação.
- Modelo Meta RAG: pesquisa sobre LLMs baseados em recuperação.
- Perplexity AI: busca conversacional aumentada por recuperação.
Referências/Leituras Adicionais
- Lewis et al. “Geração Aumentada de Recuperação para PNL Intensiva em Conhecimento”. NeurIPS 2020.
- Implementação do Hugging Face RAG.
- Pesquisa HAI de Stanford sobre métodos de recuperação.
- O que é RAFT? RAG + Ajuste Fino