Conjunto de dados chinês

简体中文数据集

Conjunto de dados chineses de alta qualidade para modelos de IA e fala

Visão geral

Título (Idioma)

Conjunto de dados do idioma chinês

Tipos de conjuntos de dados

Call Center, Música, Monólogo com Roteiro, Dados de Mídia (Dados de Podcast)

País

China

Descrição

Este conjunto de dados inclui conversas telefônicas sintéticas não roteirizadas entre agentes e clientes (5 a 15 minutos), conversas telefônicas naturais entre humanos (15 a 60 minutos) e áudio cantado com transcrições, fornecendo diversos dados de fala para treinamento e avaliação de tecnologias de fala e linguagem.

Caso de uso

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Detalhes do conjunto de dados

Língua Tipo de conjunto de dados Taxa de amostragem Palestrantes Canal Total de horas Número total de palestrantes
Canto Chinês Música KHz 48 Alto-falante único Mono 06:11:32 10
Chinês (tradicional) Monólogo com script KHz 48 Alto-falante único Mono 1,499:00:00 1,805
Inglês com sotaque chinês Dados de mídia KHz 16 Vários alto-falantes Mono 306:04:58 2,130
Chinês Simplificado Monólogo com script KHz 48 Alto-falante único Mono 2,761:00:00 3,725
Inglês com sotaque chinês e americano Call Center KHz 8 Oradores 2 Dual 152:18:33 2,058
Inglês com sotaque chinês e americano Dados de mídia KHz 16 Vários alto-falantes Mono 245:55:15 468

Clientes em destaque

Capacitando equipes para construir produtos de IA líderes mundiais.

Shaip - Contate-nos

Não consegue encontrar o que procura?

Novos conjuntos de dados prontos para uso estão sendo coletados em todos os tipos de dados

Entre em contato conosco agora para deixar de lado suas preocupações com a coleta de dados de treinamento de áudio/fala

  • Este campo é para fins de validação e deve ser deixado inalterado.
  • Ao me registrar, concordo com Shaip Política de Privacidade e Termos de Serviço e fornecer meu consentimento para receber comunicações de marketing B2B da Shaip.