Conjunto de dados DICOM para imagens médicas para aplicações avançadas de IA/ML na área da saúde.
Desidentificado conjuntos de dados de imagens DICOM Com metadados preservados — e relatórios opcionais de estudos radiológicos — para acelerar o treinamento, a validação e a pesquisa clínica do modelo.
Dados de imagem DICOM criados para IA do mundo real
Shaip oferece soluções preparadas para IA Conjuntos de dados de imagens médicas DICOM Projetada para ajudar equipes de IA na área da saúde a construir, treinar e validar modelos robustos para diagnóstico, triagem e suporte à decisão, usando dados anonimizados que preservam o valor clínico.
instantâneo do conjunto de dados
- Total de estudos:10M +
- Principais áreas geográficas (por estudos): EUA, Brasil e Índia
- Modalidades representadas: CR, TC, US, DX, RM, MG, OT, RF, NM, Mamografia
- Partes do corpo representadas: Tórax, abdômen, cabeça, coluna, pescoço, coração e muito mais
Casos de uso comuns para conjuntos de dados de imagens DICOM
Treinar modelos de IA para diagnóstico por imagem
- Detecção de anormalidades
- Classificação de Isease
- Classificação/estadiamento da gravidade
- Priorização da triagem
- Apoia o desenvolvimento multimodal
Validar e comparar o desempenho do modelo
- Avaliar a precisão do modelo em populações mais amplas.
- Desempenho de referência por modalidade/região corporal
- Execute validação externa para reduzir o sobreajuste.
Melhorar a robustez do modelo em diferentes dispositivos e locais.
- Generalização de testes entre scanners/fornecedores
- Reduza as quedas de desempenho ao implantar em novos hospitais.
Criar IA multimodal (imagem + relatório radiológico)
- Derivar rótulos fracos da linguagem do relatório
- Treine modelos alinhados com as narrativas dos relatórios.
- Criar sistemas de triagem e apoio à decisão orientados por relatórios.
Pesquisa clínica e criação de coortes
- Filtre os grupos por modalidade/parte do corpo/tempo.
- Apoiar estudos retrospectivos
- Acelere os testes de hipóteses, mantendo os controles de privacidade.
Criação de anotações e dados de referência para treinamento de aprendizado de máquina.
- Etiquetas de classificação
- caixas delimitadoras
- Máscaras de segmentação
O que você recebe no conjunto de dados de imagens DICOM
1. Dados de pixel DICOM (as imagens)
Todas as imagens são anonimizadas ao nível do pixel:
- O texto nas imagens foi ocultado ou pseudonimizado.
- Artefatos de "desfiguração facial" podem ser introduzidos quando a reconstrução facial é possível (por exemplo, tomografia computadorizada de alta resolução).
3. Relatório do estudo (opcional, quando disponível)
Texto narrativo não estruturado escrito pelo radiologista/médico, com anonimização Safe Harbor e a mesma abordagem de alteração de data aplicada.
2. Metadados DICOM (com Safe Harbor)
Todos os metadados DICOM padrão são preservados para entrega, enquanto os identificadores HIPAA Safe Harbor são anonimizados, incluindo:
- O nome do paciente foi substituído pelo número de identificação do paciente.
- Identificação do paciente criptografada
- O nome da instituição foi substituído por um nome alternativo.
- As datas foram alteradas dentro de um período de 365 dias (alteração consistente ao nível do paciente).
4. Metadados personalizados (valor agregado opcional)
Os metadados derivados opcionais podem incluir:
- Idade do paciente analisada
- Etiquetas SNOMED (do relatório)
- Entidades positivas (do relatório)
- País de residência (a partir do endereço)
- Raça/Etnia imputada (campos derivados)
Métodos de desidentificação DICOM com foco na privacidade
O conjunto de dados utiliza hash criptográfico e pseudonimização para estar em conformidade com a HIPAA, preservando sua utilidade clínica e protegendo dados sensíveis.
Proteção ao nível do pixel
Redação/pseudonimização de texto gravado e remoção de elementos visuais quando necessário.
Proteção de Metadados
Os identificadores do Safe Harbor foram anonimizados, enquanto os metadados DICOM padrão foram preservados.
Mudança de data
As datas são ajustadas dentro de um intervalo de 365 dias, no nível do paciente, para preservar as relações temporais entre os estudos.
Pisos Demográficos
Determinados campos têm limites máximos ou mínimos para reduzir o risco de reidentificação (por exemplo, idade, peso, altura e alguns valores de etnia).
Não consegue encontrar o que procura?
Novos conjuntos de dados médicos prontos para uso estão sendo coletados em todos os tipos de dados
Entre em contato conosco agora para deixar de lado suas preocupações com a coleta de dados de treinamento em saúde
Perguntas Frequentes (FAQ)
1. O que é um conjunto de dados de imagem DICOM?
Um conjunto de dados de imagens DICOM é uma coleção de estudos de imagens médicas armazenados no padrão DICOM, incluindo dados de pixels e metadados clínicos, comumente usado para treinar e validar modelos de IA na área da saúde.
2. O que está incluído neste conjunto de dados de imagens DICOM?
Dependendo do escopo da licença, pode incluir dados de pixel DICOM, metadados DICOM preservados (desidentificados), relatórios de estudo opcionais e metadados personalizados opcionais de valor agregado.
3. As imagens foram desidentificadas?
Sim. As imagens são desidentificadas ao nível do pixel, incluindo a redação/pseudonimização do texto nas imagens e a remoção de elementos gráficos quando necessário.
4. Os metadados DICOM são preservados?
Os metadados DICOM padrão são preservados para entrega, enquanto os identificadores HIPAA Safe Harbor são anonimizados (por exemplo, identificadores de paciente/instituição e datas).
5. Como as datas são tratadas?
As datas podem ser alteradas em até 365 dias, sendo essa alteração aplicada de forma consistente ao nível do paciente para preservar a cronologia relativa entre os estudos.
6. Os laudos radiológicos/de exames estão incluídos?
Quando disponíveis e licenciados, os relatórios de estudo (texto narrativo não estruturado) podem ser incluídos, com os identificadores pseudonimizados.
7. Quais metadados personalizados podem estar disponíveis?
As opções podem incluir a idade do paciente analisada, etiquetas SNOMED, entidades positivas, país de residência e outros campos derivados.
8. Posso solicitar um grupo específico (modalidade, parte do corpo, localização geográfica, etc.)?
Sim, compartilhe seu escopo e filtros desejados, e Shaip sugerirá o conjunto de dados mais adequado com base na disponibilidade.
9. Como faço para licenciar o conjunto de dados?
Envie suas necessidades através do formulário de contato. Nossa equipe confirmará a disponibilidade, o escopo, os termos de licenciamento e as opções de entrega.