Conversas sintéticas sobre saúde para ASR

Habilitando o desenvolvimento de tecnologia ambiental por meio de conversas sintéticas sobre saúde

Tecnologia ambiental

Mais de 2000 horas de dados de áudio coletados e transcritos em ambiente clínico

No domínio em rápida evolução da IA ​​Conversacional, uma das aplicações notáveis ​​está no setor de saúde, onde a tecnologia é utilizada para agilizar as interações entre médico e paciente. Nosso cliente, um nome líder em tecnologia de saúde, abordou a Shaip com a necessidade de aprimorar seu modelo de Reconhecimento Automático de Fala (ASR) para melhor compreender e transcrever conversas com vários alto-falantes em ambientes clínicos. Devido às regulamentações de privacidade, adquirir diálogos do mundo real era um desafio; portanto, a ideia era criar e transcrever interações sintéticas, porém realistas, entre profissionais de saúde e pacientes.

Volume

2,000 horas ou aproximadamente 12,000 para 24,000 interações sintéticas individuais de 10 duração média de minutos.

Objetivo

Nosso objetivo principal era gerar cerca de 2,000 horas de gravações de áudio, traduzindo de 12,000 a 24,000 interações sintéticas meticulosamente elaboradas, incorporando uma diversidade de gênero, idade, sotaques e funções médicas. Este conjunto de dados abrangente e autêntico, projetado para imitar diálogos clínicos do mundo real, foi criado respeitando rigorosamente as regulamentações de privacidade, como a HIPAA. As interações sintéticas serviram como um rico conjunto de dados, fundamental para treinar e refinar o modelo ASR do nosso cliente, melhorando significativamente sua proficiência no tratamento de conversas do mundo real em ambientes clínicos.

 

Objetivos

Desafios

Conformidade Regulamentar

Garantir a adesão às leis de privacidade, como a HIPAA, e ao mesmo tempo criar interações de saúde realistas, porém sintéticas, pode ser um desafio.

Conformidade regulatória

Autenticidade e Diversidade de Dados

Criar interações sintéticas que imitem com precisão os diálogos clínicos do mundo real, ao mesmo tempo que abrangem uma ampla variedade de cenários, sotaques, idades e funções médicas, exige uma abordagem meticulosa e profundo conhecimento do domínio.

Autenticidade e diversidade de dados

Garantia da Qualidade

Alcançar um alto nível de precisão na transcrição, como a taxa de precisão de palavras (WER) de 95% e a taxa de precisão de tags (TER) de 90%, exige processos rigorosos de garantia de qualidade.

Capacidades Técnicas

Garantir que a infraestrutura técnica, incluindo as plataformas de gravação e transcrição, possa lidar com o volume de dados e manter a qualidade é um desafio significativo.

Recrutamento e treinamento de recursos

Recrutar indivíduos com formação médica para dramatizações e garantir que eles sigam cenários realistas enquanto mantêm um fluxo natural de conversação pode ser bastante desafiador. Além disso, treinar transcritores para aderir a diretrizes de qualidade rigorosas requer esforço e experiência substanciais.

Abordagem/Solução

Coleta e transcrição de áudio

  • Criação de cenário: Desenvolveu cenários realistas que refletem condições não urgentes comuns encontradas em práticas de medicina familiar para adultos, como hipertensão, diabetes e tratamento da dor.
  • Encenação: Recrutou indivíduos com formação médica para atuar como prestadores de cuidados de saúde e pacientes, aderindo aos cenários fornecidos e simulando conversas clínicas do mundo real.
  • Gravação: Utilizei o Shaip Work Mobile App para captura de áudio, garantindo uma representação diversificada em termos de gênero, idade, sotaques e experiências profissionais entre os participantes.

Validação e Transcrição

  • Executei scripts de validação para garantir a precisão e qualidade dos arquivos de áudio.
  • As transcrições foram realizadas na plataforma Bhasha, seguindo orientações específicas fornecidas e garantindo a transcrição literal do texto com diarização precisa.
  • Metadados anotados, incluindo ID do palestrante, idade, sexo, idioma nativo e treinamento/experiência médica, que foram essenciais para fins de treinamento do modelo do cliente.

Garantia da Qualidade

  • Verificações de qualidade abrangentes realizadas pelo CQA e PMO garantiram uma meta de qualidade de transcrição de 95% de taxa de precisão de palavras (WER) e 90% de taxa de precisão de tags (TER).

Entrega de dados

  • Estruturei os dados de maneira clara e organizada e os entreguei em lotes, juntamente com notas detalhadas de lote e diretórios de cultura.
  • Garantiu que todos os dados, incluindo arquivos de áudio, transcrições e metadados, fossem rotulados e formatados com precisão de acordo com as especificações do cliente.

Feedback e iteração

Estabeleci um ciclo robusto de feedback com o cliente para identificar quaisquer deficiências, garantindo que as correções fossem feitas e um conjunto de dados completo e preciso fosse entregue.

Principais Realizações

  • Coleta e transcrição bem-sucedidas de 2000 horas de interações sintéticas de saúde.
  • Transcrição rápida e precisa com uma taxa de precisão notável, contribuindo significativamente para o objetivo do cliente de aprimorar seu modelo ASR.
  • Demonstrou a capacidade da Shaip em lidar com projetos complexos e de grande escala com uma abordagem meticulosa em relação à qualidade e precisão.

Resultado

O projeto meticulosamente executado e facilitado pela Shaip resultou em um rico conjunto de dados que contribuiu significativamente para o aprimoramento do modelo ASR do cliente. As interações sintéticas criaram uma representação realista dos diálogos clínicos, auxiliando o cliente na obtenção de um serviço de fala mais robusto e confiável para ambientes de saúde. Através de uma abordagem estruturada e bem coordenada, a Shaip garantiu a entrega bem-sucedida de um projeto complexo dentro do prazo estipulado, solidificando a sua experiência na gestão de projetos de IA conversacional em grande escala no domínio da saúde.

Nossa colaboração com Shaip avançou significativamente nosso projeto em Tecnologia Ambiental e IA Conversacional na área da saúde. A sua experiência na criação e transcrição de diálogos sintéticos sobre cuidados de saúde proporcionou uma base sólida, mostrando o potencial dos dados sintéticos na superação de desafios regulamentares. Com a Shaip, superamos esses obstáculos e agora estamos um passo mais perto de concretizar nossa visão de soluções intuitivas de saúde.

Dourado-5 estrelas

Acelere sua IA de saúde
desenvolvimento de aplicativos em 100%