Serviços de coleta de dados de fala mais confiáveis para sua IA
Treine seus modelos de PNL, VAs, protótipos de TTS e muito mais com dados de conversação de qualidade, com nossos serviços de coleta de dados de áudio e fala
Descubra pipelines de dados de áudio sem gargalos.
Clientes em destaque
Por que o conjunto de dados de treinamento de fala é necessário para o processamento de linguagem natural?
Você já notou seu smartphone VA, ou seja, Siri, Bixby ou qualquer outra coisa, interagindo? A maneira como eles respondem a todas as perguntas e analisam e apresentam resultados de acordo com suas necessidades!
Bem, por mais que esses VAs nos intriguem, esses recursos e programas inteligentes precisam ser treinados progressivamente para serem capazes de responder com a mesma precisão. Esta é a razão pela qual você deve considerar terceirizar a coleta de dados de voz/áudio e voz para empresas especializadas em coleta de dados, com experiência profissional de validação.
Investir na coleta de dados de áudio prepara seu suposto PNL para atender a um público multilíngue. Não apenas isso, a coleta de dados de fala para PNL, como e quando manipulada por um especialista, leva em consideração a coleta em campo, a análise semântica e a transcrição de áudio. Com soluções profissionais de coleta de dados de fala, você pode:
- Adquira conjuntos de dados de áudio de alta qualidade para melhorar a precisão
- Configuração de cenário diverso de destino
- Colete dados de treinamento de IA multilíngues
- Dimensione seu modelo de ML para atender a diversos segmentos demográficos e verticais
Serviços profissionais de coleta de dados de áudio/voz para PNL
Qualquer assunto. Qualquer cenário.
Os sistemas inteligentes de PNL são tudo menos genéricos. Dependendo da funcionalidade do programa, você pode ter que se concentrar em serviços de dados de áudio espaciais e multilíngues, que só podem ser oferecidos por empresas de coleta de dados de voz/áudio de renome. É aqui que a Shaip entra no esquema das coisas como um provedor de serviços de conexão de dados altamente confiável que se orgulha de fazer o trabalho pesado para suas IAs supostamente inteligentes.
Na Shaip, nosso foco principal é alimentar modelos com o maior volume possível de amostras de fala personalizadas, no menor tempo possível. Conosco a bordo, você pode esperar:
- Coleta de dados de áudio/voz com curadoria para PNL
- Programas sob medida que respondem de acordo com casos de uso específicos
- Preparando a mineração de conjuntos de dados de áudio
- Processamento de dados automatizado e específico para padrões
- Nível mais alto possível de especificidade de domínio
- Tempo de colocação no mercado mais rápido com modelos de IA acelerados
Nossa especialidade
Alinhar dados de áudio para preparar modelos de NLP inteligentes
A Shaip oferece serviços de coleta de dados de fala/áudio de ponta a ponta em mais de 100 idiomas para permitir que tecnologias habilitadas para voz atendam a um conjunto diversificado de públicos em todo o mundo. Podemos trabalhar em projetos de qualquer escopo e tamanho; desde o licenciamento de conjuntos de dados de áudio prontos para uso, até o gerenciamento de coleta de dados de áudio personalizada, até a transcrição e anotação de áudio. Não importa o tamanho do seu projeto de coleta de dados de fala, podemos personalizar os serviços de coleta de áudio para atender às suas necessidades para criar conjuntos de dados de PNL de alta qualidade que visam dialetos, tons e idiomas. Escolha entre nossa ampla variedade de conjuntos de dados de fala e recursos de coleta de dados de áudio para configurações inteligentes que habilitam a voz.
Coleção de fala monólogo
Lide com requisitos baseados em fala referentes a um alto-falante autônomo para seus protótipos Text-to-Speed e requisitos específicos de transcrições com alimentação de prompt com script, por meio de arquivos de canal único.
Discurso de Diálogo
Coleção
Configure assistentes virtuais inteligentes, chatbots específicos de velocidade e modelos de reconhecimento automático de fala com exposição multilíngue por meio de arquivos de canal duplo e recursos transcritos.
Dados acústicos
Coleção
Podemos gravar profissionalmente dados de áudio com qualidade de estúdio, sejam restaurantes, escritórios ou residências ou de vários ambientes e idiomas, por meio de nossa rede global de colaboradores, cobrindo uma faixa acústica mais ampla
Coleção de enunciados de linguagem natural
Treine configurações comerciais inteligentes para identificar frases de clientes proferidas de maneira diferente com significado semelhante, para tornar as IAs mais autônomas com o tempo
Digitais / Virtuais
Assistentes
Concentre-se em construir seu próximo Assistente Virtual treinando modelos com advertências de fala humana, exposição multilíngue, análise contextual e NLU.
Reconhecimento Automático de Fala (ASR)
Melhore a precisão de seus sistemas de reconhecimento automático de fala (ASR) tendo acesso a conjuntos de dados de fala/áudio diversificados de última geração, de uma ampla variedade de dados demográficos.
Dados de treinamento de fala/áudio multilíngue
Nossos profissionais de idiomas altamente qualificados em todo o mundo oferecem dados de treinamento de áudio/fala multilíngues em vários idiomas e dialetos, incluindo árabe, dinamarquês, chinês, africâner, Cingapura, Nova Zelândia, hebraico, indonésio, irlandês, coreano, malaio, polonês, escocês, sueco , francês, alemão, vietnamita, tailandês, italiano, espanhol e muito mais.
Texto a Voz
(TTS)
Para oferecer uma melhor experiência ao usuário com o TTS, é fundamental desenvolver um sistema que soe natural. Crie um modelo multilíngue de conversão de texto em fala (TTS) com a ajuda de nossa força de trabalho global, que ajuda você a coletar dados de fala em mais de 150 idiomas e dialetos para aprimorar seus modelos de IA de controles no carro a chatbots e soluções de aprendizado com alta dados de áudio de qualidade.
Razões para escolher a Shaip como seu parceiro confiável de coleta de dados de fala
Pessoas
Equipes dedicadas e treinadas:
- Mais de 30,000 colaboradores para criação de dados, rotulagem e controle de qualidade
- Equipe de gerenciamento de projetos credenciada
- Equipe de desenvolvimento de produto experiente
- Equipe de integração e terceirização de pool de talentos
Extração
A mais alta eficiência do processo é garantida com:
- Processo robusto 6 Sigma Stage-Gate
- Uma equipe dedicada de black belts 6 Sigma - Principais proprietários de processos e conformidade de qualidade
- Melhoria Contínua e Feedback Loop
Plataforma
A plataforma patenteada oferece benefícios:
- Plataforma ponta a ponta baseada na web
- Qualidade impecável
- TAT mais rápido
- Entrega perfeita
Pessoas
Equipes dedicadas e treinadas:
- Mais de 30,000 colaboradores para criação de dados, rotulagem e controle de qualidade
- Equipe de gerenciamento de projetos credenciada
- Equipe de desenvolvimento de produto experiente
- Equipe de integração e terceirização de pool de talentos
Extração
A mais alta eficiência do processo é garantida com:
- Processo robusto 6 Sigma Stage-Gate
- Uma equipe dedicada de black belts 6 Sigma - Principais proprietários de processos e conformidade de qualidade
- Melhoria Contínua e Feedback Loop
Plataforma
A plataforma patenteada oferece benefícios:
- Plataforma ponta a ponta baseada na web
- Qualidade impecável
- TAT mais rápido
- Entrega perfeita
Idioma: conjuntos de dados de áudio coletados
Conjuntos de dados de fala/áudio prontos para uso
Adicionar ao carrinho | ID do Corpus (único) | Palavra-chave | Conjunto de dados de idioma | Código do idioma | Taxa de amostragem | Tipo de conjunto de dados | Total de horas de áudio | Breve Descrição | Descrição do conjunto de dados | Canal de Áudio | Plataforma de Gravação | NÓS SOMOS (%) | Formato de áudio | Formato de transcrição | Caso de uso | Número de falantes | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
en_US_CC_8 | Vernácula afro-americana | Vernácula afro-americana | en_US | KHz 8 | Central de Atendimento | 211 | Dados vernaculares afro-americanos do call center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 612, Masculino: 1242 e Desconhecido: 12 | Contato | |
en_US_MA_16 | Vernácula afro-americana | Vernácula afro-americana | en_US | KHz 16 | Áudio de mídia | 154 | Dados de mídia vernacular afro-americana | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 151, Masculino: 150 e Desconhecido: 10 | Contato | |
Africâner_GC_8 | afrikaans | afrikaans | af_ZA | KHz 8 | Conversa Geral | 368 | Dados de conversação geral em africâner | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, africâner falado na África | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 502, Masculino: 390 e Desconhecido: 2 | Contato | |
africâner_MA_16 | afrikaans | afrikaans | af_ZA | KHz 16 | Áudio de mídia | 658 | Arquivos de mídia em africâner | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 750, Masculino: 1278 e Desconhecido: 52 | Contato | |
Árabe_GC_8 | Arabe | Arabe | ar_AE | KHz 8 | Conversa Geral | 292 | Dados de conversação geral em árabe | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, árabe dos países do Golfo | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 171, Masculino: 534 e Desconhecido: 1 | Contato | |
Árabe_SM_48 | Arabe | Arabe | ar-SA | KHz 48 | Monólogo com script | 1,947 | Monólogo Script em Árabe | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 838 Masculino 1209 Desconhecido 78 | Contato | |
Assamês_CC_8 | Assamese | Assamês (em Pipeline) | como em | Central de Atendimento | 60 | Dados do call center assamês (em pipeline) | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Assamês_GC | Assamese | Assamês (em Pipeline) | como em | Conversa Geral | 100 | Dados de conversação geral assamês (em pipeline) | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Assamês_MA | Assamese | Assamês (em Pipeline) | como em | Áudio de mídia | 40 | Dados de áudio de mídia Assamese (In Pipeline) | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Bengali_CC_8 | bengali | Bengali (em pipeline) | bn_IN | Central de Atendimento | 60 | Bengali (In Pipeline) Dados de call-center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Bengali_GC | bengali | Bengali (em pipeline) | bn_IN | Conversa Geral | 100 | Bengali (In Pipeline) Dados de conversação geral | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Bengali_MA | bengali | Bengali (em pipeline) | bn_IN | Áudio de mídia | 40 | Dados de áudio de mídia bengali (em pipeline) | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Boston_CC_8 | Inglês de Boston | Inglês de Boston | en_US | KHz 8 | Central de Atendimento | 177 | Dados do call center de Boston | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 605, Masculino: 711 e Desconhecido: 0 | Contato | |
Boston_GC_8 | Inglês de Boston | Inglês de Boston | en_US | KHz 8 | Conversa Geral | 32 | Dados de conversas gerais de Boston | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 53, Masculino: 83 e Desconhecido: 0 | Contato | |
Boston_MA_16 | Inglês de Boston | Inglês de Boston | en_US | KHz 16 | Áudio de mídia | 93 | Dados de áudio do Boston Media | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 43, Masculino: 181 e Desconhecido: 2 | Contato | |
Canadense_SM_48 | Francês canadense | Francês canadense | fr-CA | KHz 48 | Monólogo com script | 1,222 | Francês canadense | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 974 Masculino 631 Desconhecido 1 | Contato | |
chinês_CC_8 | Inglês chinês | Inglês chinês | en_US | KHz 8 | Central de Atendimento | 169 | Dados do call center chinês | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 1790, Masculino: 523 e Desconhecido: 13 | Contato | |
Chinês_MA_16 | Inglês chinês | Inglês chinês | en_US | KHz 16 | Áudio de mídia | 249 | Dados de áudio da mídia chinesa | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 126, Masculino: 346 e Desconhecido: 6 | Contato | |
Chinês Simplificado_SM_48 | Chinês Simplificado | Chinês Simplificado | zh-CN | KHz 48 | Monólogo com script | 2,762 | Chinês Simplificado | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1920 Masculino 1535 Desconhecido 270 | Contato | |
Chinês Tradicional_SM_48 | Tradicional Chinesa | Tradicional Chinesa | zh-TW | KHz 48 | Monólogo com script | 1,028 | Tradicional Chinesa | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1069 Masculino 262 Desconhecido 3 | Contato | |
Dinamarquês_GC_8 | Dinamarquês | Dinamarquês | da_DK | KHz 8 | Conversa Geral | 372 | Dados de conversação geral em dinamarquês | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 311, Masculino: 417, Desconhecido: 0 | Contato | |
Dinamarquês_MA_16 | Dinamarquês | Dinamarquês | da_DK | KHz 16 | Áudio de mídia | 664 | dados de áudio da mídia dinamarquesa | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino: 369, Masculino: 864, Desconhecido: 27 | Contato | |
Dinamarquês_SM_48 | Dinamarquês | Dinamarquês | da-DK | KHz 48 | Monólogo com script | 2,579 | Monólogo com roteiro dinamarquês | Gravações de um único enunciado, que tendem a cair na faixa de 5 a 30 segundos, dinamarquês da Dinamarca | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1551 Masculino 1233 Desconhecido 42 | Contato | |
Sul profundo inglês_CC_8 | Sul profundo inglês | Sul profundo inglês | en_US | KHz 8 | Central de Atendimento | 151 | Dados do centro de atendimento da English Deep South | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 221, Masculino 1004, Desconhecido 7 | Contato | |
Sul profundo inglês_GC_8 | Sul profundo inglês | Sul profundo inglês | en_US | KHz 8 | Conversa Geral | 56 | Dados de conversação geral do inglês profundo do sul | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 99, Masculino 31, Desconhecido 0 | Contato | |
Sul profundo inglês_MA_16 | Sul profundo inglês | Sul profundo inglês | en_US | KHz 16 | Áudio de mídia | 266 | Dados de áudio da English Deep South Media | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 204, Masculino 356, Desconhecido 21 | Contato | |
Alemão_CC_8 | Alemão | Alemão | de-De | KHz 8 | Central de Atendimento | 64 | Dados do call center alemão | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Mono | Computador de mesa | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 478 Masculino 1440 Desconhecido 0 | Contato | ||
Alemão_IVR_8 | Alemão | Alemão | de-De | KHz 8 | IVR | 200 | Dados de IVR da Alemanha | Humano para Máquina. Um tipo de fluxo IVR em que há um prompt TTS (por exemplo, "Como posso ajudá-lo") seguido por uma resposta humana espontânea | Mono | Computador de mesa | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 10115 Masculino 8750 Desconhecido 0 | Contato | ||
Guzerate_CC_8 | gujarati | Gujarati (em pipeline) | gu_IN | Central de Atendimento | 60 | Gujarati (In Pipeline) Dados de call-center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Gujarati_GC | gujarati | Gujarati (em pipeline) | gu_IN | Conversa Geral | 100 | Gujarati (em pipeline) dados de conversação geral | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Gujarati_MA | gujarati | Gujarati (em pipeline) | gu_IN | Áudio de mídia | 40 | Dados de áudio de mídia Gujarati (em pipeline) | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Hebraico_Conversação Geral_8 | hebraico | hebraico | ele_IL | KHz 8 | Conversa Geral | 399 | Dados de conversação geral em hebraico | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, hebraico em Israel | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 414, Masculino 399, Desconhecido 1 | Contato | |
Hebraico_MA_16 | hebraico | hebraico | ele_IL | KHz 16 | Áudio de mídia | 427 | Dados de áudio da mídia hebraica | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 361, Masculino 513, Desconhecido 13 | Contato | |
Hindi_MA_16 | hindi | hindi | oi_IN | KHz 16 | Áudio de mídia | 219 | Dados de áudio de mídia hindi | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 83, Masculino 309, Desconhecido 0 | Contato | |
Hindi_SM_48 | hindi | hindi | oi-IN | KHz 48 | Monólogo com script | 2,867 | Monólogo Script Hindi | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1977 Masculino 1864 Desconhecido 147 | Contato | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | KHz 8 | Central de Atendimento | 208 | HINGLISH Dados do call center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 822, Masculino 1262, Desconhecido 0 | Contato | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | KHz 16 | Áudio de mídia | 216 | HINGLISH Dados de áudio de mídia | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 75, Masculino 380, Desconhecido 0 | Contato | |
Hispânico_CC_8 | Inglês hispânico | Inglês hispânico | en_US | KHz 8 | Central de Atendimento | 212 | Dados hispânicos do call center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 822, Masculino 1262, Desconhecido 0 | Contato | |
Hispânico_MA_16 | Inglês hispânico | Inglês hispânico | en_US | KHz 16 | Áudio de mídia | 155 | Áudio de mídia de chamada hispânica | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 140, Masculino 219, Desconhecido 5 | Contato | |
Indonésio_GC_8 | Indonésio | Indonésio | Eu fiz | KHz 8 | Conversa Geral | 496 | Dados de conversação geral em indonésio | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, bahasa indonésio | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 524, Masculino 454, Desconhecido 2 | Contato | |
Indonésio_MA_16 | Indonésio | Indonésio | Eu fiz | KHz 16 | Áudio de mídia | 643 | Dados de áudio da mídia indonésia | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 746, Masculino 1507, Desconhecido 129 | Contato | |
Irlandês_GC_8 | Irlandês | Irlandês | pt_IE | KHz 8 | Conversa Geral | 192 | Dados de Conversação Geral Irlandesa | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 213, Masculino 153, Desconhecido 0 | Contato | |
Japonês_SM_48 | Japonês | Japonês | ja-JP | KHz 48 | Monólogo com script | 2,335 | Monólogo com roteiro japonês | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1460 Masculino 1221 Desconhecido 194 | Contato | |
Kannada_CC_8 | kannada | Kannada (em pipeline) | kn_IN | Central de Atendimento | 60 | Dados do call center Kannada (em pipeline) | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Kannada_GC | kannada | Kannada (em pipeline) | kn_IN | Conversa Geral | 100 | Kannada (In Pipeline) Dados de conversação geral | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Kannada_MA | kannada | Kannada (em pipeline) | kn_IN | Áudio de mídia | 40 | Kannada (In Pipeline) Dados de áudio de mídia | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Coreano_CC_8 | Coreana | Coreana | ko_KR | KHz 8 | Central de Atendimento | 107 | Dados do call center coreano | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1086, Masculino 210, Desconhecido 4 | Contato | |
Coreano_MA_16 | Coreana | Coreana | ko_KR | KHz 16 | Áudio de mídia | 204 | Dados de áudio da mídia coreana | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 70 Masculino 303, Desconhecido 25 | Contato | |
Coreano_SM_48 | Coreana | Coreana | ko-KR | KHz 48 | Monólogo com script | 1,955 | Monólogo com roteiro coreano | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1195 Masculino 1134 Desconhecido 122 | Contato | |
malaio_GC_8 | Malay | Malay | ms_MY | KHz 8 | Conversa Geral | 266 | Dados de conversação geral em malaio | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, malaio na Malásia | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 316, Masculino 176, Desconhecido 0 | Contato | |
malaio_MA_16 | Malay | Malay | ms_MY | KHz 16 | Áudio de mídia | 344 | Dados de áudio da mídia malaia | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 236, Masculino 626, Desconhecido 47 | Contato | |
Malaiala_CC_8 | malayalam | Malayalam (em Pipeline) | ml_IN | Central de Atendimento | 60 | Malayalam (In Pipeline) Dados de call-center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Malaiala_GC | malayalam | Malayalam (em Pipeline) | ml_IN | Conversa Geral | 100 | Malayalam (In Pipeline) Dados de conversação geral | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Malaiala_MA | malayalam | Malayalam (em Pipeline) | ml_IN | Áudio de mídia | 40 | Malayalam (In Pipeline) Dados de áudio de mídia | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Marathi_CC_8 | marata | Marathi (em pipeline) | senhor_IN | Central de Atendimento | 60 | Dados do call center Marathi (em pipeline) | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Marathi_GC | marata | Marathi (em pipeline) | senhor_IN | Conversa Geral | 100 | Marathi (em pipeline) dados de conversação geral | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Marathi_MA | marata | Marathi (em pipeline) | senhor_IN | Áudio de mídia | 40 | Dados de áudio de mídia Marathi (em pipeline) | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Mexicano_SM_48 | Espanhol (México) | Espanhol (México) | es-MX | KHz 48 | Monólogo com script | 1,492 | Monólogo com roteiro em espanhol mexicano | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1016 Masculino 1069 Desconhecido 95 | Contato | |
Holanda_SM_48 | Neerlandês | Neerlandês | pt-BR | KHz 48 | Monólogo com script | 1,205 | Monólogo Script Holandês | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1285 Masculino 531 Desconhecido 3 | Contato | |
Nova York English_CC_8 | Inglês de Nova York | Inglês de Nova York | en_US | KHz 8 | Central de Atendimento | 103 | Dados do call center em inglês de Nova York | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 610, Masculino 532, Desconhecido 0 | Contato | |
Nova York English_GC_8 | Inglês de Nova York | Inglês de Nova York | en_US | KHz 8 | Conversa Geral | 107 | Dados de conversação geral em inglês de Nova York | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 118, Masculino 114, Desconhecido 0 | Contato | |
Nova York English_MA_16 | Inglês de Nova York | Inglês de Nova York | en_US | KHz 16 | Áudio de mídia | 140 | Dados de áudio do New York English Media | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 66, Masculino 230, Desconhecido 11 | Contato | |
Nova Zelândia_GC_8 | Nova Zelândia Inglês | Nova Zelândia Inglês | en_NZ | KHz 8 | Conversa Geral | 148 | Dados de conversação geral em inglês da Nova Zelândia | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 167, masculino 121, Desconhecido 4 | Contato | |
Nova Zelândia_MA_16 | Nova Zelândia Inglês | Nova Zelândia Inglês | en_NZ | KHz 16 | Áudio de mídia | 400 | Áudio de mídia em inglês da Nova Zelândia | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 367, masculino 678, Desconhecido 26 | Contato | |
Oriya_CC_8 | Oriya | Oriya (Em Pipeline) | ou_IN | Central de Atendimento | 60 | Oriya (In Pipeline) Dados do Call-Center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Oriya_GC | Oriya | Oriya (Em Pipeline) | ou_IN | Conversa Geral | 100 | Oriya (In Pipeline) Dados de conversação geral | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Oriya_MA | Oriya | Oriya (Em Pipeline) | ou_IN | Áudio de mídia | 40 | Oriya (In Pipeline) Dados de áudio de mídia | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Polonês_MA_16 | Polaco | Polaco | pl_PL | KHz 16 | Áudio de mídia | 269 | Áudio da mídia polonesa | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 173 Masculino 354 Desconhecido 6 | Contato | |
Polônia Polonesa_SM_48 | Polonês (Polônia) | Polonês (Polônia) | pl-PL | KHz 48 | Monólogo com script | 1,482 | Polônia polonesa - monólogo com roteiro | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1324 Masculino 701 Desconhecido 24 | Contato | |
Punjabi_CC_8 | Punjabi | Punjabi (em pipeline) | Punjabi | Central de Atendimento | 60 | Punjabi (In Pipeline) Dados de call-center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Punjabi_GC | Punjabi | Punjabi (em pipeline) | Punjabi | Conversa Geral | 100 | Punjabi (In Pipeline) Dados de conversação geral | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Punjabi_MA | Punjabi | Punjabi (em pipeline) | Punjabi | Áudio de mídia | 40 | Punjabi (In Pipeline) Dados de áudio de mídia | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Russo_SM_48 | Russo | Russo | ru-RU | KHz 48 | Monólogo com script | 2,398 | Monólogo com roteiro russo | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1689 Masculino 1937 Desconhecido 214 | Contato | |
Escocês_GC_8 | escocês (sotaque inglês) | escocês (sotaque inglês) | pt_AB | KHz 8 | Conversa Geral | 292 | Dados de Conversação Geral Escocesa | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 285, Masculino 260, Desconhecido 3 | Contato | |
Cingapura_CC_8 | Singapura Inglês | Singapura Inglês | pt_SG | KHz 8 | Central de Atendimento | 218 | Dados do call center de Cingapura | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 2139, Masculino 884, Desconhecido 21 | Contato | |
Singapura_MA_16 | Singapura Inglês | Singapura Inglês | pt_SG | KHz 16 | Áudio de mídia | 247 | Dados de áudio da Singapore Media | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 160, Masculino 455, Desconhecido 37 | Contato | |
Inglês sul-africano_CC_8 | Inglês sul-africano | Inglês sul-africano | pt_ZA | KHz 8 | Central de Atendimento | 261 | Dados da central de atendimento em inglês da África do Sul | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1274, Masculino 935, Desconhecido 1 | Contato | |
Inglês sul-africano_MA_16 | Inglês sul-africano | Inglês sul-africano | pt_ZA | KHz 16 | Áudio de mídia | 251 | Dados de áudio da mídia inglesa da África do Sul | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 235, Masculino 432, Desconhecido 36 | Contato | |
Suaíli_CC_8 | swahili | swahili | sw_KE | KHz 8 | Central de Atendimento | 230 | dados Swahili Call-Center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 611, Masculino 833, Desconhecido 0 | Contato | |
Suaíli_MA_16 | swahili | swahili | sw_KE | KHz 16 | Áudio de mídia | 265 | dados de áudio Swahili Media | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 118, Masculino 493, Desconhecido 25 | Contato | |
Sueco_CC_8 | sueco | sueco | sv_SE | KHz 8 | Central de Atendimento | 250 | Dados do call center sueco | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1581, masculino 727, Desconhecido 2 | Contato | |
Sueco_MA_16 | sueco | sueco | sv_SE | KHz 16 | Áudio de mídia | 278 | Dados de áudio da mídia sueca | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 195, masculino 500, Desconhecido 21 | Contato | |
Tâmil_CC_8 | tâmil | Tâmil (em pipeline) | ta_IN | Central de Atendimento | 60 | Dados de call center tâmil (em pipeline) | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Tamil_GC | tâmil | Tâmil (em pipeline) | ta_IN | Conversa Geral | 100 | Dados de conversação geral em tâmil (em pipeline) | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Tamil_MA | tâmil | Tâmil (em pipeline) | ta_IN | Áudio de mídia | 40 | Dados de áudio de mídia tâmil (em pipeline) | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Telugu_GC_8 | telugu | telugu | te_IN | KHz 8 | Conversa Geral | 553 | Dados de conversas gerais em télugo | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 574, Masculino 564, Desconhecido 0 | Contato | |
Telugu_MA_16 | telugu | telugu | te_IN | KHz 16 | Áudio de mídia | 648 | Dados de áudio da Telugu Media | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 207, Masculino 963, Desconhecido 2 | Contato | |
Telugu_CC_8 | telugu | Télugo (em pipeline) | te_IN | Central de Atendimento | 30 | Telugu (In Pipeline) Dados de call-center | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Telugu_GC | telugu | Télugo (em pipeline) | te_IN | Conversa Geral | 50 | Telugu (In Pipeline) Dados de conversação geral | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Telugu_MA | telugu | Télugo (em pipeline) | te_IN | Áudio de mídia | 20 | Telugu (In Pipeline) Dados de áudio de mídia | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Contato | ||||
Tailandês_GC_8 | Tailandês | Tailandês | th_TH | KHz 8 | Conversa Geral | 183 | Conversa Geral Tailandesa | Conversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do Áudio (Intervalo) - 15-60 minutos, Um registro informal usado entre amigos | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 338, Masculino 96, Desconhecido 8 | Contato | |
Tailandês_MA_8 | Tailandês | Tailandês | th_TH | KHz 16 | Áudio de mídia | 173 | áudio da mídia tailandesa | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 143, Masculino 502, Desconhecido 26 | Contato | |
Turco Turquia_SM_48 | Turquia turca | Turquia turca | tr-TR | KHz 48 | Monólogo com script | 2,027 | Turquia turca | Gravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundos | Mono | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 1561 Masculino 1241 Desconhecido 31 | Contato | |
vietnamita_GC_8 | Vietnamita | Vietnamita | vi_VN | KHz 8 | Conversa Geral | 295 | Dados de conversação geral vietnamita | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, norte (por exemplo, Hanói), central e sul (por exemplo, cidade de Ho Chi Minh). | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 400, masculino 380, Desconhecidos 2 | Contato | |
vietnamita_MA_16 | Vietnamita | Vietnamita | vi_VN | KHz 16 | Áudio de mídia | 257 | Dados de áudio da mídia vietnamita | Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutos | Mono | Fornecimento da Web | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 249, masculino 200, Desconhecidos 45 | Contato | |
galês_GC_8 | galês (sotaque inglês) | galês (sotaque inglês) | pt_WL | KHz 8 | Conversa Geral | 278 | Dados de Conversação Geral do País de Gales | Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, | Dual | Computador de mesa | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Feminino 270, Masculino 324, Desconhecido 0 | Contato | |
Inglês do Reino Unido_WW_16 | Inglês do Reino Unido | Inglês do Reino Unido | en_uk | KHz 16 | Palavra de Despertar | Speakers 200 | Wake Word Inglês do Reino Unido | coleção de frases-chave de dados
| canaleta 1 | Mobile App | 5.0 | . Wav | json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Sexo: 50% masculino, 50% feminino, +/- 10%. | Contato |
Serviços oferecidos
A coleta de dados de áudio especializada não é prática para configurações abrangentes de IA. Na Shaip, você pode até considerar os seguintes serviços para tornar os modelos muito mais difundidos do que o habitual:
Coleta de Dados de Texto
Serviços
O verdadeiro valor dos serviços de coleta de dados cognitivos da Shaip é que eles fornecem às organizações a chave para desbloquear informações críticas encontradas em dados não estruturados
Serviços de coleta de dados de imagens
Certifique-se de que seu modelo de visão computacional identifique cada imagem com precisão, para treinar perfeitamente os modelos de IA de última geração do futuro
Serviços de coleta de dados de vídeo
Agora concentre-se na visão computacional junto com a PNL para treinar seus modelos para identificar objetos, indivíduos, impedimentos e outros elementos visuais com perfeição
Recursos Recomendados
Oferta
Anotação de áudio para IAs inteligentes
Os serviços de anotação de áudio têm sido um forte da Shaip desde o início. Desenvolva, treine e melhore a IA de conversação, chatbots e mecanismos de reconhecimento de fala com nossos serviços de anotação de áudio de última geração.
Guia do Comprador
Guia do comprador: guia completo para IA conversacional
O chatbot com o qual você conversou é executado em um sistema avançado de IA conversacional que é treinado, testado e construído usando vários conjuntos de dados de reconhecimento de fala.
Catálogo de Dados
Catálogo e licenciamento de dados de fala prontos para uso
Há uma grande variedade de aplicativos comuns para dados de fala em projetos de IA. Oferecemos-lhe grandes quantidades de dados de alta qualidade prontos para o seu reconhecimento de voz.
Quer construir seu próprio conjunto de dados de áudio?
Conecte-se com nosso especialista interno em coleta de dados de fala para configurar um repositório de áudio que melhor atenda às suas necessidades
Perguntas Mais Frequentes (FAQ)
A coleta de dados de fala para um modelo de ML refere-se ao processo de coleta de gravações de áudio da linguagem falada. Esta coleção auxilia no treinamento e no refinamento de algoritmos de aprendizado de máquina, principalmente aqueles centrados na compreensão e processamento de vozes humanas.
Ao coletar dados de áudio para Reconhecimento Automático de Fala (ASR), você deve começar definindo as necessidades específicas do seu projeto, incluindo o idioma, sotaque e tipo de fala desejados. Após definir esses parâmetros, certifique-se de obter todas as permissões necessárias para respeitar a privacidade do usuário. Em seguida, use dispositivos de gravação ou software apropriados para capturar amostras de áudio nítidas. Cada gravação deve ser meticulosamente anotada com sua transcrição ou outros metadados pertinentes e armazenada sistematicamente para acesso fácil.
Um conjunto de dados de fala em aprendizado de máquina é fundamental para treinar, testar e validar modelos adaptados para reconhecer, transcrever ou interpretar a linguagem falada. Esses conjuntos de dados abrem caminho para uma infinidade de aplicações, desde assistentes de voz e serviços de transcrição até biometria de voz.
Para recolher dados precisos de diversas línguas e sotaques, é vital a colaboração com falantes nativos das origens linguísticas desejadas. Procure obter uma amostra variada e representativa para cobrir um amplo espectro de nuances demográficas. Empregue equipamentos de gravação padronizados em ambientes uniformes para garantir a consistência do áudio. E o mais importante, anote cada dado com transcrições e metadados detalhados, denotando o idioma e o sotaque específicos.