Conjunto de dados Kannada

A melhor opção

Conjunto de dados de alta qualidade de call center em Kannada, conversas gerais, monólogos com roteiro e mídia (podcast) para modelos de IA e fala

Visão geral

Título (Idioma)

Conjunto de dados da língua canarês

Tipos de conjuntos de dados

Call Center, Conversação Geral, Dados de Mídia, Monólogo Roteirizado

País

India

Descrição

Este conjunto de dados inclui conversas telefônicas sintéticas não roteirizadas entre agentes e clientes (5 a 15 minutos), arquivos de áudio ou vídeo de domínio público licenciáveis, como entrevistas e podcasts com 1 a 5 participantes (15 a 60 minutos) e monólogos roteirizados em que um único locutor fornece conteúdo predefinido para treinamento e avaliação de modelos de fala e linguagem.

Caso de uso

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Detalhes do conjunto de dados

Tipo de conjunto de dados Taxa de amostragem Palestrantes Canal Total de horas Número total de palestrantes
Call Center KHz 8 Oradores 2 Dual 59:57:02 494
Call Center KHz 16 Oradores 2 Mono 195:26:56 9,504
Conversa Geral KHz 8 Oradores 2 Dual 141:27:15 424
Dados de mídia KHz 16 Vários alto-falantes Mono 14:19:52 124
Monólogo com script KHz 24 Alto-falante único Mono 500:00:00 No Pedido

Clientes em destaque

Capacitando equipes para construir produtos de IA líderes mundiais.

Amazon
Google
Microsoft
Shaip entre em contato conosco

Não consegue encontrar o que procura?

Novos conjuntos de dados prontos para uso estão sendo coletados em todos os tipos de dados

Entre em contato conosco agora para deixar de lado suas preocupações com a coleta de dados de treinamento de áudio/fala

  • Este campo é para fins de validação e deve ser deixado inalterado.
  • Ao me registrar, concordo com Shaip Política de Privacidade e Termos de Serviço e fornecer meu consentimento para receber comunicações de marketing B2B da Shaip.