conjunto de dados coreano

한국어 데이터셋

Conjunto de dados de alta qualidade de call center coreano, monólogo com roteiro e mídia (podcast) para modelos de IA e fala

Visão geral

Título (Idioma)

Conjunto de dados do idioma coreano

Tipos de conjuntos de dados

Call Center, Dados de Mídia, Monólogo Roteirizado

País

Coréia

Descrição

Este conjunto de dados inclui conversas telefônicas sintéticas não roteirizadas entre agentes e clientes (5 a 15 minutos), arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas e podcasts com 1 a 5 participantes (15 a 60 minutos) e monólogos roteirizados apresentando um único locutor apresentando conteúdo predefinido para treinamento de modelos de fala e linguagem.

Caso de uso

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Detalhes do conjunto de dados

Tipo de conjunto de dados Taxa de amostragem Palestrantes Canal Total de horas Número total de palestrantes
Call Center KHz 8 Oradores 2 Dual 102:27:55 1,244
Dados de mídia KHz 16 Vários alto-falantes Mono 203:46:54 397
Monólogo com script KHz 24 Alto-falante único Mono 500:00:00 No Pedido
Monólogo com script KHz 48 Alto-falante único Mono 1,955:00:00 No Pedido

Clientes em destaque

Capacitando equipes para construir produtos de IA líderes mundiais.

Amazon
Google
Microsoft
Shaip - Contate-nos

Não consegue encontrar o que procura?

Novos conjuntos de dados prontos para uso estão sendo coletados em todos os tipos de dados

Entre em contato conosco agora para deixar de lado suas preocupações com a coleta de dados de treinamento de áudio/fala

  • Este campo é para fins de validação e deve ser deixado inalterado.
  • Ao me registrar, concordo com Shaip Política de Privacidade e Termos de Serviço e fornecer meu consentimento para receber comunicações de marketing B2B da Shaip.