Estudo de caso: IA conversacional

Precisão de dados oncológicos: licenciamento, desidentificação e anotação para inovação de modelo de PNL

Revolucionando o tratamento do câncer com tecnologias de ponta em PNL.

Desenvolvimento de PNL em Oncologia

Visão geral do projeto

O cliente, um importante player no setor de saúde, precisava de uma solução avançada de PNL para processar um volume substancial de registros médicos oncológicos. Como parte de uma iniciativa fundamental para aperfeiçoar a investigação oncológica, a necessidade de equilibrar a análise detalhada de dados com padrões de privacidade rigorosos é fundamental. Este estudo de caso descreve nossas contribuições para aprimorar os esforços de pesquisa do cliente por meio de anotação de dados de alta fidelidade, práticas rigorosas de desidentificação e aplicação de técnicas de Processamento de Linguagem Natural (PNL), tudo dentro da estrutura regulatória fornecida pela HIPAA.

Desenvolvimento de PNL em Oncologia

Estatísticas Chave

Licenciamento de dados
+ Dados De-id

páginas 10,000

Não Oncologia
Domínio

páginas 10,000

Oncologia
Domínio

páginas 10,000

Oncologia
Relacionamentos

páginas 4500

Negação

páginas 9000

NER + Relacionamento
Mapeamento

páginas 1223

Desafios

O projeto exigiu uma compreensão diferenciada da documentação clínica, identificação precisa de entidades médicas e a capacidade de aplicar rótulos de negação com precisão, tudo dentro de uma estrutura segura que protege a privacidade do paciente de acordo com os regulamentos da HIPAA. A empreitada exigiu não apenas conhecimentos técnicos no tratamento de grandes volumes de dados complexos, mas também uma abordagem estratégica para incorporar feedback e manter a qualidade em todas as fases do processo de anotação.

Descrição detalhada dos serviços:

  • Cobertura abrangente de dados clínicos: Abrangendo vários tipos de notas, cenários de atendimento e subespecialidades oncológicas, garantindo um conjunto de dados robusto que reflita diversos cenários clínicos.
  • Desidentificação rigorosa: Garantir que todos os registros rotulados sejam desidentificados em conformidade com o método Safe Harbor da HIPAA, garantindo a confiança do cliente na privacidade e segurança dos dados.
  • Diretrizes de anotação: Criação e implementação de diretrizes padrão de anotação de dados para preparação de registros rotulados de acordo com os padrões HIPAA.
  • Técnicas avançadas de anotação: Aplicação de PNL a 10,000 páginas de registros relacionados à oncologia, envolvendo rotulagem complexa de status de negação e outros detalhes relevantes, conforme diretrizes previamente estabelecidas.
  • Rigorosa Garantia de Qualidade: Atingir o padrão de qualidade especificado na diretriz.

Solução

Nossa abordagem envolveu as seguintes estratégias principais:

Cobertura abrangente de dados clínicos

Para adaptar o conjunto de dados às necessidades específicas do cliente, uma seleção direcionada de dados foi meticulosamente extraída do extenso repositório de Shaip de mais de 5 milhões de Registros Eletrônicos de Saúde. Este conjunto de dados com curadoria abrangeu uma variedade de tipos de notas e configurações de cuidados, fornecendo uma rica e diversa
espectro de cenários clínicos. Isso garante um conjunto de dados que não é apenas abrangente, mas também altamente representativo de dados médicos do mundo real.

Desidentificação rigorosa

O processo seguiu rigorosamente o método Safe Harbor da HIPAA para desidentificação, que garante a confiança do cliente na privacidade e segurança dos dados. Isto envolve a remoção de todas as informações de saúde protegidas (PHI) e a sua substituição por espaços reservados rotulados, mantendo assim a utilidade dos dados e protegendo ao mesmo tempo a confidencialidade do paciente.

Variáveis ​​de desidentificação

CategoriaSubcategoria
NomeNome do paciente, Nome do médico, Nome do enfermeiro, Nome do membro da família, Nome do centro médico, Nome da clínica, Nome da casa de repouso, Nome da empresa, Nome da universidade
Idade 
DataPadrão de data, padrão Mês Ano, Padrão Dia Mês, Padrão Dia Ano, Dia, Mês, Ano, Temporada
Localização:País, Estado, Cidade, Rua, CEP, Número do quarto, Número da suíte, Número do andar
IDNúmero de segurança social, número do registro médico, número do beneficiário do plano de saúde, número da conta, número do certificado/licença, identificação biométrica, identificação do registro, número de acesso, número de identificação do veículo, número da placa, identificadores do dispositivo e número de série
ContatoNúmero de telefone, número de fax, endereço de e-mail, URL da Web, endereço IP

Exemplo:

Em 25 de setembro de 2106, às 11h, o Sr. Harry Pace, de 00 anos, foi internado no Forrest General Hospital para uma cirurgia programada de quadril, previamente consultado por seu médico de cuidados primários, Dr. MD. Durante sua estada, esteve sob os cuidados de Mary Hu, NP, e Suzan Ray, RN, sendo R. Charles Melancon, PA, também consultado. Sua operação, realizada no mesmo dia da internação, foi bem-sucedida e não houve relato de complicações. Após a cirurgia, o Sr. Pace foi transferido para a sala 90, andar 202, para recuperação. Sua esposa, Emma Pace, esteve presente e recebeu todas as atualizações necessárias. Durante a sua breve estadia, os seus registos médicos, incluindo o MRN MR2 e a conta KV99062619, foram tratados de acordo com os protocolos padrão do Gracewood Nursing Home, a sua residência anterior. Ele recebeu alta no mesmo dia para os cuidados da Clínica Ambulatorial de Oakland para maior recuperação. Ao longo do processo, todos os procedimentos foram documentados e protegidos com adesão aos padrões de confidencialidade.

Exemplo: desidentificado

On [Padrão de data], às 11h, o Sr. [Nome do paciente], envelhecido [Era], foi admitido [Nome do Centro Médico] para uma cirurgia programada de quadril, previamente consultada por seu médico de cuidados primários, Dr. [Nome do Médico], e com a presença de [Nome do Médico] MD. Durante sua estada, ele esteve sob os cuidados de [Enfermeira], NP, e [Enfermeira], RN, com [Nome do Médico], PA, também sendo consultado. Sua operação, realizada no mesmo dia da admissão, foi bem-sucedida, sem complicações relatadas. Após a cirurgia, o Sr. [Nome do paciente] foi transferido para a Sala nº. [Número da sala], Andar n.º [Número do andar], para recuperação. Sua esposa, [Nome do membro da família], esteve presente durante todo o tempo e recebeu todas as atualizações necessárias. Durante sua breve estadia, seus registros médicos, incluindo MRN [Número do prontuário médico] e conta [Número da conta], foram tratados de acordo com os protocolos padrão de [Nome da casa de repouso], sua residência anterior. Ele recebeu alta mais tarde no mesmo dia para os cuidados de [Nome da clínica] para recuperação adicional. Ao longo do processo, todos os procedimentos foram documentados e protegidos com adesão aos padrões de confidencialidade.

Diretrizes de anotação e técnicas avançadas de anotação

Shaip foi fundamental no estabelecimento e implementação de diretrizes de anotação de dados padrão, garantindo que todos os registros rotulados fossem preparados de forma consistente e em conformidade com os padrões HIPAA. Além disso, 10,000 páginas de vários registros médicos foram meticulosamente anotadas, com
um foco na rotulagem detalhada de status de negação e outras entidades clinicamente relevantes, incluindo várias subespecialidades de oncologia. A anotação foi realizada por uma equipe de anotadores especialistas com conhecimento especializado em oncologia e regulamentações de privacidade de dados.

Anotação complexa

CategoriaSubcategoria
Data
Anotação
(Oncologia)
Data do diagnóstico, data do estágio, início, data do procedimento, data de início da medicação, data de término da medicação,
Data de início da radiação, data de término da radiação
Doença
(Oncologia)
Problema de câncer, histologia, estado clínico, localização corporal, comportamento, grau, estágio de câncer, estágio TNM, teste de marcador tumoral, dimensões, código
Tratamentos Ayurvédicos
(Oncologia)
Medicina contra o câncer, dosagem de medicamentos, frequência, cirurgia de câncer, resultado da cirurgia, modalidade de radiação, dosagem de radiação
GenômicaCódigo de variação, gene estudado, método, amostra
NegaçãoNegativo, Possível Negativo, Incerto, Possível Positivo
NER clínico
Relacionamentos
Problema do câncer – Local do corpo, Histologia – Local do corpo, Comportamento – Local do corpo, Cirurgia do câncer – Local do corpo, Modalidade de radiação – Local do corpo, Histologia – Grau, Problema do câncer – Dimensão

Exemplo:

Declaração de Nota Clínica Oncológica

Declaração de Nota Clínica Oncológica

“A paciente Jane Doe foi diagnosticada com câncer de pulmão de células não pequenas (NSCLC) em estágio IIIB, especificamente adenocarcinoma, em 03/05/2023. O câncer está localizado no lobo inferior direito do pulmão. É classificado como T3N2M0 de acordo com o sistema de estadiamento TNM, com tamanho tumoral de 5 cm x 3 cm. Uma deleção do exon 19 do EGFR foi identificada através da análise de PCR da amostra da biópsia do tumor. A quimioterapia com Carboplatina AUC 5 e Pemetrexedo 500 mg/m² foi iniciada em 03/20/2023 e deve ser administrada a cada 3 semanas. A radioterapia por feixe externo (EBRT) na dose de 60 Gy em 30 frações foi iniciada em 04/01/2023. O tratamento do paciente está em andamento e não há evidências de metástases cerebrais na ressonância magnética recente. A possibilidade de invasão linfovascular ainda não foi determinada e a tolerância do paciente ao regime quimioterápico completo permanece incerta.

Declaração de nota clínica de oncologia:

Declaração de Nota Clínica Oncológica

Rigorosa garantia de qualidade

Implementou uma estrutura flexível de gerenciamento de projetos que facilitou a integração efetiva do feedback do cliente, mantendo padrões de qualidade rigorosos. Um protocolo abrangente de garantia de qualidade foi aplicado, alinhando-se com as diretrizes para atingir os benchmarks de qualidade necessários. Este protocolo apresentou rodadas sucessivas de revisão e verificação, garantindo a precisão e confiabilidade dos dados anotados. Essa supervisão meticulosa de qualidade é crucial na elaboração de uma solução de PNL confiável, vital para a tomada de decisões clínicas informadas e excelência em pesquisa.

O Resultado

Entregou com sucesso 10,000 registros de alta qualidade, desidentificados e rotulados, fornecendo um conjunto de dados seguro e valioso para o desenvolvimento do modelo de PNL do cliente. A aplicação meticulosa de PNL e a adesão aos padrões de desidentificação HIPAA resultaram em um conjunto de dados altamente refinado que sustentará os esforços de pesquisa oncológica contínuos e futuros do cliente, visando, em última análise, melhorar os resultados dos pacientes oncológicos e a eficiência da prestação de cuidados.

O sucesso do projeto ilustra nossa capacidade de lidar com dados médicos complexos com precisão, contribuindo para o objetivo do cliente de melhorar os resultados do atendimento ao paciente e acelerar o ritmo da inovação na área da saúde.

Nossa parceria com a Shaip tem sido fundamental para o avanço de nossas capacidades de PNL no domínio da oncologia. O tratamento profissional de 10,000 prontuários, anotados com negação detalhada e outras entidades clínicas, demonstrou seu compromisso com a excelência e a conformidade. Além disso, o seu compromisso com padrões de privacidade como a HIPAA proporcionou-nos recursos inestimáveis ​​para impulsionar as nossas iniciativas de IA no desenvolvimento de tratamentos e diagnósticos oncológicos de ponta.

Estrela de Ouro 5