Estudo de caso: IA conversacional
Precisão de dados oncológicos: licenciamento, desidentificação e anotação para inovação de modelo de PNL
Revolucionando o tratamento do câncer com tecnologias de ponta em PNL.
Visão geral do projeto
O cliente, um importante player no setor de saúde, precisava de uma solução avançada de PNL para processar um volume substancial de registros médicos oncológicos. Como parte de uma iniciativa fundamental para aperfeiçoar a investigação oncológica, a necessidade de equilibrar a análise detalhada de dados com padrões de privacidade rigorosos é fundamental. Este estudo de caso descreve nossas contribuições para aprimorar os esforços de pesquisa do cliente por meio de anotação de dados de alta fidelidade, práticas rigorosas de desidentificação e aplicação de técnicas de Processamento de Linguagem Natural (PNL), tudo dentro da estrutura regulatória fornecida pela HIPAA.
Estatísticas Chave
Licenciamento de dados
+ Dados De-id
páginas 10,000
Não Oncologia
Domínio
páginas 10,000
Oncologia
Domínio
páginas 10,000
Oncologia
Relacionamentos
páginas 4500
Negação
páginas 9000
NER + Relacionamento
Mapeamento
páginas 1223
Desafios
O projeto exigiu uma compreensão diferenciada da documentação clínica, identificação precisa de entidades médicas e a capacidade de aplicar rótulos de negação com precisão, tudo dentro de uma estrutura segura que protege a privacidade do paciente de acordo com os regulamentos da HIPAA. A empreitada exigiu não apenas conhecimentos técnicos no tratamento de grandes volumes de dados complexos, mas também uma abordagem estratégica para incorporar feedback e manter a qualidade em todas as fases do processo de anotação.
Descrição detalhada dos serviços:
- Cobertura abrangente de dados clínicos: Abrangendo vários tipos de notas, cenários de atendimento e subespecialidades oncológicas, garantindo um conjunto de dados robusto que reflita diversos cenários clínicos.
- Desidentificação rigorosa: Garantir que todos os registros rotulados sejam desidentificados em conformidade com o método Safe Harbor da HIPAA, garantindo a confiança do cliente na privacidade e segurança dos dados.
- Diretrizes de anotação: Criação e implementação de diretrizes padrão de anotação de dados para preparação de registros rotulados de acordo com os padrões HIPAA.
- Técnicas avançadas de anotação: Aplicação de PNL a 10,000 páginas de registros relacionados à oncologia, envolvendo rotulagem complexa de status de negação e outros detalhes relevantes, conforme diretrizes previamente estabelecidas.
- Rigorosa Garantia de Qualidade: Atingir o padrão de qualidade especificado na diretriz.
Solução
Nossa abordagem envolveu as seguintes estratégias principais:
Cobertura abrangente de dados clínicos
Para adaptar o conjunto de dados às necessidades específicas do cliente, uma seleção direcionada de dados foi meticulosamente extraída do extenso repositório de Shaip de mais de 5 milhões de Registros Eletrônicos de Saúde. Este conjunto de dados com curadoria abrangeu uma variedade de tipos de notas e configurações de cuidados, fornecendo uma rica e diversa
espectro de cenários clínicos. Isso garante um conjunto de dados que não é apenas abrangente, mas também altamente representativo de dados médicos do mundo real.
Desidentificação rigorosa
O processo seguiu rigorosamente o método Safe Harbor da HIPAA para desidentificação, que garante a confiança do cliente na privacidade e segurança dos dados. Isto envolve a remoção de todas as informações de saúde protegidas (PHI) e a sua substituição por espaços reservados rotulados, mantendo assim a utilidade dos dados e protegendo ao mesmo tempo a confidencialidade do paciente.
Variáveis de desidentificação
| Categoria | Subcategoria |
|---|---|
| Nome | Nome do paciente, Nome do médico, Nome do enfermeiro, Nome do membro da família, Nome do centro médico, Nome da clínica, Nome da casa de repouso, Nome da empresa, Nome da universidade |
| Idade | |
| Data | Padrão de data, padrão Mês Ano, Padrão Dia Mês, Padrão Dia Ano, Dia, Mês, Ano, Temporada |
| Localização: | País, Estado, Cidade, Rua, CEP, Número do quarto, Número da suíte, Número do andar |
| ID | Número de segurança social, número do registro médico, número do beneficiário do plano de saúde, número da conta, número do certificado/licença, identificação biométrica, identificação do registro, número de acesso, número de identificação do veículo, número da placa, identificadores do dispositivo e número de série |
| Contato | Número de telefone, número de fax, endereço de e-mail, URL da Web, endereço IP |
Exemplo:
Em 25 de setembro de 2106, às 11h, o Sr. Harry Pace, de 00 anos, foi internado no Forrest General Hospital para uma cirurgia programada de quadril, previamente consultado por seu médico de cuidados primários, Dr. MD. Durante sua estada, esteve sob os cuidados de Mary Hu, NP, e Suzan Ray, RN, sendo R. Charles Melancon, PA, também consultado. Sua operação, realizada no mesmo dia da internação, foi bem-sucedida e não houve relato de complicações. Após a cirurgia, o Sr. Pace foi transferido para a sala 90, andar 202, para recuperação. Sua esposa, Emma Pace, esteve presente e recebeu todas as atualizações necessárias. Durante a sua breve estadia, os seus registos médicos, incluindo o MRN MR2 e a conta KV99062619, foram tratados de acordo com os protocolos padrão do Gracewood Nursing Home, a sua residência anterior. Ele recebeu alta no mesmo dia para os cuidados da Clínica Ambulatorial de Oakland para maior recuperação. Ao longo do processo, todos os procedimentos foram documentados e protegidos com adesão aos padrões de confidencialidade.
Exemplo: desidentificado
On [Padrão de data], às 11h, o Sr. [Nome do paciente], envelhecido [Era], foi admitido [Nome do Centro Médico] para uma cirurgia programada de quadril, previamente consultada por seu médico de cuidados primários, Dr. [Nome do Médico], e com a presença de [Nome do Médico] MD. Durante sua estada, ele esteve sob os cuidados de [Enfermeira], NP, e [Enfermeira], RN, com [Nome do Médico], PA, também sendo consultado. Sua operação, realizada no mesmo dia da admissão, foi bem-sucedida, sem complicações relatadas. Após a cirurgia, o Sr. [Nome do paciente] foi transferido para a Sala nº. [Número da sala], Andar n.º [Número do andar], para recuperação. Sua esposa, [Nome do membro da família], esteve presente durante todo o tempo e recebeu todas as atualizações necessárias. Durante sua breve estadia, seus registros médicos, incluindo MRN [Número do prontuário médico] e conta [Número da conta], foram tratados de acordo com os protocolos padrão de [Nome da casa de repouso], sua residência anterior. Ele recebeu alta mais tarde no mesmo dia para os cuidados de [Nome da clínica] para recuperação adicional. Ao longo do processo, todos os procedimentos foram documentados e protegidos com adesão aos padrões de confidencialidade.
Diretrizes de anotação e técnicas avançadas de anotação
Shaip foi fundamental no estabelecimento e implementação de diretrizes de anotação de dados padrão, garantindo que todos os registros rotulados fossem preparados de forma consistente e em conformidade com os padrões HIPAA. Além disso, 10,000 páginas de vários registros médicos foram meticulosamente anotadas, com
um foco na rotulagem detalhada de status de negação e outras entidades clinicamente relevantes, incluindo várias subespecialidades de oncologia. A anotação foi realizada por uma equipe de anotadores especialistas com conhecimento especializado em oncologia e regulamentações de privacidade de dados.
Anotação complexa
| Categoria | Subcategoria |
|---|---|
| Data Anotação (Oncologia) | Data do diagnóstico, data do estágio, início, data do procedimento, data de início da medicação, data de término da medicação, Data de início da radiação, data de término da radiação |
| Doença (Oncologia) | Problema de câncer, histologia, estado clínico, localização corporal, comportamento, grau, estágio de câncer, estágio TNM, teste de marcador tumoral, dimensões, código |
| Tratamentos Ayurvédicos (Oncologia) | Medicina contra o câncer, dosagem de medicamentos, frequência, cirurgia de câncer, resultado da cirurgia, modalidade de radiação, dosagem de radiação |
| Genômica | Código de variação, gene estudado, método, amostra |
| Negação | Negativo, Possível Negativo, Incerto, Possível Positivo |
| NER clínico Relacionamentos | Problema do câncer – Local do corpo, Histologia – Local do corpo, Comportamento – Local do corpo, Cirurgia do câncer – Local do corpo, Modalidade de radiação – Local do corpo, Histologia – Grau, Problema do câncer – Dimensão |
Exemplo:
Declaração de Nota Clínica Oncológica
“A paciente Jane Doe foi diagnosticada com câncer de pulmão de células não pequenas (NSCLC) em estágio IIIB, especificamente adenocarcinoma, em 03/05/2023. O câncer está localizado no lobo inferior direito do pulmão. É classificado como T3N2M0 de acordo com o sistema de estadiamento TNM, com tamanho tumoral de 5 cm x 3 cm. Uma deleção do exon 19 do EGFR foi identificada através da análise de PCR da amostra da biópsia do tumor. A quimioterapia com Carboplatina AUC 5 e Pemetrexedo 500 mg/m² foi iniciada em 03/20/2023 e deve ser administrada a cada 3 semanas. A radioterapia por feixe externo (EBRT) na dose de 60 Gy em 30 frações foi iniciada em 04/01/2023. O tratamento do paciente está em andamento e não há evidências de metástases cerebrais na ressonância magnética recente. A possibilidade de invasão linfovascular ainda não foi determinada e a tolerância do paciente ao regime quimioterápico completo permanece incerta.
Declaração de nota clínica de oncologia:
Rigorosa garantia de qualidade
Implementou uma estrutura flexível de gerenciamento de projetos que facilitou a integração efetiva do feedback do cliente, mantendo padrões de qualidade rigorosos. Um protocolo abrangente de garantia de qualidade foi aplicado, alinhando-se com as diretrizes para atingir os benchmarks de qualidade necessários. Este protocolo apresentou rodadas sucessivas de revisão e verificação, garantindo a precisão e confiabilidade dos dados anotados. Essa supervisão meticulosa de qualidade é crucial na elaboração de uma solução de PNL confiável, vital para a tomada de decisões clínicas informadas e excelência em pesquisa.
O Resultado
Entregou com sucesso 10,000 registros de alta qualidade, desidentificados e rotulados, fornecendo um conjunto de dados seguro e valioso para o desenvolvimento do modelo de PNL do cliente. A aplicação meticulosa de PNL e a adesão aos padrões de desidentificação HIPAA resultaram em um conjunto de dados altamente refinado que sustentará os esforços de pesquisa oncológica contínuos e futuros do cliente, visando, em última análise, melhorar os resultados dos pacientes oncológicos e a eficiência da prestação de cuidados.
O sucesso do projeto ilustra nossa capacidade de lidar com dados médicos complexos com precisão, contribuindo para o objetivo do cliente de melhorar os resultados do atendimento ao paciente e acelerar o ritmo da inovação na área da saúde.
Nossa parceria com a Shaip tem sido fundamental para o avanço de nossas capacidades de PNL no domínio da oncologia. O tratamento profissional de 10,000 prontuários, anotados com negação detalhada e outras entidades clínicas, demonstrou seu compromisso com a excelência e a conformidade. Além disso, o seu compromisso com padrões de privacidade como a HIPAA proporcionou-nos recursos inestimáveis para impulsionar as nossas iniciativas de IA no desenvolvimento de tratamentos e diagnósticos oncológicos de ponta.