conjunto de dados suaíli
Hifadhidata ya Kiswahili
Conjunto de dados de call center e mídia (podcast) em suaíli de alta qualidade para modelos de IA e fala
Visão geral
Título (Idioma)
Conjunto de dados da língua suaíli
Tipos de conjuntos de dados
Call Center, Mídia (Podcast)
País
Tanzânia, Quênia e Uganda
Descrição
Este conjunto de dados inclui conversas telefônicas sintéticas não programadas entre agentes e clientes (5 a 15 minutos) e arquivos de áudio ou vídeo de domínio público licenciáveis, como entrevistas e podcasts com 1 a 5 participantes (15 a 60 minutos).
Caso de uso
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Detalhes do conjunto de dados
| Tipo de conjunto de dados | Taxa de amostragem | Palestrantes | Canal | Total de horas | Número total de palestrantes |
|---|---|---|---|---|---|
| Call Center | KHz 8 | Oradores 2 | Dual | 229:59:55 | 544 |
| Música | KHz 16 | Vários alto-falantes | Mono | 264:34:45 | 636 |
Clientes em destaque
Capacitando equipes para construir produtos de IA líderes mundiais.
Não consegue encontrar o que procura?
Novos conjuntos de dados prontos para uso estão sendo coletados em todos os tipos de dados
Entre em contato conosco agora para deixar de lado suas preocupações com a coleta de dados de treinamento de áudio/fala