Conjunto de dados chinês
简体中文数据集
Conjunto de dados chineses de alta qualidade para modelos de IA e fala
Visão geral
Título (Idioma)
Conjunto de dados do idioma chinês
Tipos de conjuntos de dados
Call Center, Música, Monólogo com Roteiro, Dados de Mídia (Dados de Podcast)
País
China
Descrição
Este conjunto de dados inclui conversas telefônicas sintéticas não roteirizadas entre agentes e clientes (5 a 15 minutos), conversas telefônicas naturais entre humanos (15 a 60 minutos) e áudio cantado com transcrições, fornecendo diversos dados de fala para treinamento e avaliação de tecnologias de fala e linguagem.
Caso de uso
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Detalhes do conjunto de dados
| Língua | Tipo de conjunto de dados | Taxa de amostragem | Palestrantes | Canal | Total de horas | Número total de palestrantes |
|---|---|---|---|---|---|---|
| Canto Chinês | Música | KHz 48 | Alto-falante único | Mono | 06:11:32 | 10 |
| Chinês (tradicional) | Monólogo com script | KHz 48 | Alto-falante único | Mono | 1,499:00:00 | 1,805 |
| Inglês com sotaque chinês | Dados de mídia | KHz 16 | Vários alto-falantes | Mono | 306:04:58 | 2,130 |
| Chinês Simplificado | Monólogo com script | KHz 48 | Alto-falante único | Mono | 2,761:00:00 | 3,725 |
| Inglês com sotaque chinês e americano | Call Center | KHz 8 | Oradores 2 | Dual | 152:18:33 | 2,058 |
| Inglês com sotaque chinês e americano | Dados de mídia | KHz 16 | Vários alto-falantes | Mono | 245:55:15 | 468 |
Clientes em destaque
Capacitando equipes para construir produtos de IA líderes mundiais.
Não consegue encontrar o que procura?
Novos conjuntos de dados prontos para uso estão sendo coletados em todos os tipos de dados
Entre em contato conosco agora para deixar de lado suas preocupações com a coleta de dados de treinamento de áudio/fala