Conjunto de dados DICOM para imagens médicas para aplicações avançadas de IA/ML na área da saúde.

Desidentificado conjuntos de dados de imagens DICOM Com metadados preservados — e relatórios opcionais de estudos radiológicos — para acelerar o treinamento, a validação e a pesquisa clínica do modelo.

Conjuntos de dados de imagens DICOM

Dados de imagem DICOM criados para IA do mundo real

Shaip oferece soluções preparadas para IA Conjuntos de dados de imagens médicas DICOM Projetada para ajudar equipes de IA na área da saúde a construir, treinar e validar modelos robustos para diagnóstico, triagem e suporte à decisão, usando dados anonimizados que preservam o valor clínico.

instantâneo do conjunto de dados

  • Total de estudos:10M +
  • Principais áreas geográficas (por estudos): EUA, Brasil e Índia
  • Modalidades representadas: CR, TC, US, DX, RM, MG, OT, RF, NM, Mamografia
  • Partes do corpo representadas: Tórax, abdômen, cabeça, coluna, pescoço, coração e muito mais
dados de imagem DICOM

Casos de uso comuns para conjuntos de dados de imagens DICOM

Treinar modelos de IA para diagnóstico por imagem

Treinar modelos de IA para diagnóstico por imagem

  • Detecção de anormalidades
  • Classificação de Isease
  • Classificação/estadiamento da gravidade
  • Priorização da triagem
  • Apoia o desenvolvimento multimodal
Validar e comparar o desempenho do modelo

Validar e comparar o desempenho do modelo

  • Avaliar a precisão do modelo em populações mais amplas.
  • Desempenho de referência por modalidade/região corporal
  • Execute validação externa para reduzir o sobreajuste.
Melhorar a robustez do modelo em diferentes dispositivos e locais.

Melhorar a robustez do modelo em diferentes dispositivos e locais.

  • Generalização de testes entre scanners/fornecedores
  • Reduza as quedas de desempenho ao implantar em novos hospitais.
Criar IA multimodal (imagem + relatório radiológico)

Criar IA multimodal (imagem + relatório radiológico)

  • Derivar rótulos fracos da linguagem do relatório
  • Treine modelos alinhados com as narrativas dos relatórios.
  • Criar sistemas de triagem e apoio à decisão orientados por relatórios.
Pesquisa clínica e criação de coortes

Pesquisa clínica e criação de coortes

  • Filtre os grupos por modalidade/parte do corpo/tempo.
  • Apoiar estudos retrospectivos
  • Acelere os testes de hipóteses, mantendo os controles de privacidade.
Criação de anotações e dados de referência para treinamento em aprendizado de máquina.

Criação de anotações e dados de referência para treinamento de aprendizado de máquina.

  • Etiquetas de classificação
  • caixas delimitadoras
  • Máscaras de segmentação

O que você recebe no conjunto de dados de imagens DICOM

1. Dados de pixel DICOM (as imagens)

Todas as imagens são anonimizadas ao nível do pixel:

  • O texto nas imagens foi ocultado ou pseudonimizado.
  • Artefatos de "desfiguração facial" podem ser introduzidos quando a reconstrução facial é possível (por exemplo, tomografia computadorizada de alta resolução).

3. Relatório do estudo (opcional, quando disponível)

Texto narrativo não estruturado escrito pelo radiologista/médico, com anonimização Safe Harbor e a mesma abordagem de alteração de data aplicada.

2. Metadados DICOM (com Safe Harbor)

Todos os metadados DICOM padrão são preservados para entrega, enquanto os identificadores HIPAA Safe Harbor são anonimizados, incluindo:

  • O nome do paciente foi substituído pelo número de identificação do paciente.
  • Identificação do paciente criptografada
  • O nome da instituição foi substituído por um nome alternativo.
  • As datas foram alteradas dentro de um período de 365 dias (alteração consistente ao nível do paciente).

4. Metadados personalizados (valor agregado opcional)

Os metadados derivados opcionais podem incluir:

  • Idade do paciente analisada
  • Etiquetas SNOMED (do relatório)
  • Entidades positivas (do relatório)
  • País de residência (a partir do endereço)
  • Raça/Etnia imputada (campos derivados)

Métodos de desidentificação DICOM com foco na privacidade

O conjunto de dados utiliza hash criptográfico e pseudonimização para estar em conformidade com a HIPAA, preservando sua utilidade clínica e protegendo dados sensíveis.

Proteção ao nível do pixel

Redação/pseudonimização de texto gravado e remoção de elementos visuais quando necessário.

Proteção de Metadados

Os identificadores do Safe Harbor foram anonimizados, enquanto os metadados DICOM padrão foram preservados.

Mudança de data

As datas são ajustadas dentro de um intervalo de 365 dias, no nível do paciente, para preservar as relações temporais entre os estudos.

Pisos Demográficos

Determinados campos têm limites máximos ou mínimos para reduzir o risco de reidentificação (por exemplo, idade, peso, altura e alguns valores de etnia).

Shaip entre em contato conosco

Não consegue encontrar o que procura?

Novos conjuntos de dados médicos prontos para uso estão sendo coletados em todos os tipos de dados 

Entre em contato conosco agora para deixar de lado suas preocupações com a coleta de dados de treinamento em saúde

  • Ao me registrar, concordo com Shaip Política de Privacidade e ferrolhos de sobrepor podem ser usados para proteger uma porta de embutir pelo lado de fora. Alguns kits de corrente de segurança também permitem travamento externo com chave ou botão giratório. Termos de Serviço e fornecer meu consentimento para receber comunicações de marketing B2B da Shaip.

Um conjunto de dados de imagens DICOM é uma coleção de estudos de imagens médicas armazenados no padrão DICOM, incluindo dados de pixels e metadados clínicos, comumente usado para treinar e validar modelos de IA na área da saúde.

Dependendo do escopo da licença, pode incluir dados de pixel DICOM, metadados DICOM preservados (desidentificados), relatórios de estudo opcionais e metadados personalizados opcionais de valor agregado.

Sim. As imagens são desidentificadas ao nível do pixel, incluindo a redação/pseudonimização do texto nas imagens e a remoção de elementos gráficos quando necessário.

Os metadados DICOM padrão são preservados para entrega, enquanto os identificadores HIPAA Safe Harbor são anonimizados (por exemplo, identificadores de paciente/instituição e datas).

As datas podem ser alteradas em até 365 dias, sendo essa alteração aplicada de forma consistente ao nível do paciente para preservar a cronologia relativa entre os estudos.

Quando disponíveis e licenciados, os relatórios de estudo (texto narrativo não estruturado) podem ser incluídos, com os identificadores pseudonimizados.

As opções podem incluir a idade do paciente analisada, etiquetas SNOMED, ​​entidades positivas, país de residência e outros campos derivados.

Sim, compartilhe seu escopo e filtros desejados, e Shaip sugerirá o conjunto de dados mais adequado com base na disponibilidade.

Envie suas necessidades através do formulário de contato. Nossa equipe confirmará a disponibilidade, o escopo, os termos de licenciamento e as opções de entrega.