Conjunto de dados inglês profundo do sul
Conjunto de dados de call center, conversação geral e podcast de alta qualidade em inglês Deep South para modelos de IA e fala
Visão geral
Título (Idioma)
Conjunto de dados da língua inglesa Deep South
Tipos de conjuntos de dados
Call Center, Conversa Geral, Dados de Mídia (Podcast)
País
Sul dos Estados Unidos
Descrição
Conversas telefônicas sintéticas e sem roteiro entre um agente e um cliente estão disponíveis com durações de 5 a 15 minutos, enquanto conversas telefônicas sem roteiro entre duas pessoas geralmente variam de 15 a 60 minutos. Além disso, arquivos de áudio ou vídeo de domínio público licenciáveis, como entrevistas ou podcasts com 1 a 5 participantes, também estão disponíveis na faixa de 15 a 60 minutos.
Caso de uso
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Detalhes do conjunto de dados
| Tipo de conjunto de dados | Taxa de amostragem | Palestrantes | Canal | Total de horas | Número total de palestrantes |
|---|---|---|---|---|---|
| Call Center | KHz 8 | Oradores 2 | Dual | 266:44:22 | 634 |
| Conversa Geral | KHz 8 | Oradores 2 | Dual | 197:25:07 | 1,490 |
| Dados de mídia | KHz 16 | Vários alto-falantes | Mono | 261:20:58 | 565 |
Clientes em destaque
Capacitando equipes para construir produtos de IA líderes mundiais.
Não consegue encontrar o que procura?
Novos conjuntos de dados prontos para uso estão sendo coletados em todos os tipos de dados
Entre em contato conosco agora para deixar de lado suas preocupações com a coleta de dados de treinamento de áudio/fala
Visão geral
Título
Sul profundo inglês Conjunto de dados de idioma
Tipo de conjunto de dados
Central de Atendimento
Descrição
Conversa telefônica sintética e sem roteiro entre “agente” e “cliente”, Aprox. Duração do áudio (intervalo) 5-15 minutos.
Caso de uso
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Detalhes do conjunto de dados
Total de horas
151
Taxa de amostragem
KHz 8
Canal de Áudio
Dual
Plataforma de Gravação
Desktop
Formato de áudio
. Wav
Formato de transcrição
json
NÓS SOMOS (%)
5
Dados demográficos do conjunto de dados
País
Sul profundo inglês
Língua
Sul profundo inglês
Gênero
Feminino 221, Masculino 1004, Desconhecido 7
Número de falantes
1,232
Idade
18-50
Visão geral
Título
Sul profundo inglês Conjunto de dados de idioma
Tipo de conjunto de dados
Conversa Geral
Descrição
Conversa telefônica improvisada entre duas pessoas. Aproximadamente. Duração do áudio (faixa) – 15-60 minutos.
Caso de uso
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Detalhes do conjunto de dados
Total de horas
56
Taxa de amostragem
KHz 8
Canal de Áudio
Dual
Plataforma de Gravação
Desktop
Formato de áudio
. Wav
Formato de transcrição
json
NÓS SOMOS (%)
5
Dados demográficos do conjunto de dados
País
Sul profundo inglês
Língua
Sul profundo inglês
Gênero
Feminino 99, Masculino 31, Desconhecido 0
Número de falantes
130
Idade
18-50
Visão geral
Título
Sul profundo inglês Conjunto de dados de idioma
Tipo de conjunto de dados
Podcast
Descrição
Licensable Arquivos de áudio/vídeo de domínio público, como entrevistas, podcasts etc. – 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos.
Caso de uso
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Detalhes do conjunto de dados
Total de horas
266
Taxa de amostragem
KHz 16
Canal de Áudio
Mono
Plataforma de Gravação
Fornecimento da Web
Formato de áudio
. Wav
Formato de transcrição
json
NÓS SOMOS (%)
5
Dados demográficos do conjunto de dados
País
Sul profundo inglês
Língua
Sul profundo inglês
Gênero
Feminino 204, Masculino 356, Desconhecido 21
Número de falantes
581
Idade
18-50