Serviços de coleta de dados de fala mais confiáveis ​​para sua IA

Treine seus modelos de PNL, VAs, protótipos de TTS e muito mais com dados de conversação de qualidade, com nossos serviços de coleta de dados de áudio e fala

Coleta de dados de áudio

Descubra pipelines de dados de áudio sem gargalos

Clientes em destaque

Serviços profissionais de coleta de dados de áudio/voz

Qualquer assunto. Qualquer cenário.

Na Shaip, nossa experiência reside na criação de conjuntos de dados de fala de alta qualidade projetados para diversos requisitos de IA/ML. Oferecemos uma ampla variedade de idiomas e registramos em diversos ambientes, tornando nossos conjuntos de dados abrangentes e adaptáveis. ÓNosso foco é alimentar modelos com o maior volume de dados de fala personalizados, no menor tempo possível. Conosco a bordo, você pode esperar: 

Coleta de fala
  • Dados de áudio/voz multilíngues selecionados e de alta qualidade para melhorar a precisão
  • Nível mais alto possível de especificidade de domínio para tsegmentar cenário diversificado instalação
  •  Dimensione seu modelo de ML para atender a diversos segmentos demográficos e verticais
  • Ambientes de gravação: Qualidade de estúdio, apresentando áudio cristalino com ruído de fundo mínimo e Ambientes Naturais, onde as gravações incorporam sons ambientes para imitar situações do mundo real.

100+

Países

55K+

Dados de horas de fala

250+

Projectos

60+

Idiomas (mais de 100 dialetos)

8 / 16 / 44 / 48 kHz

Taxa de amostragem

Nossa especialidade

Alinhe os dados de áudio para modelos de PNL mais inteligentes

A Shaip oferece serviços de coleta de dados de fala/áudio de ponta a ponta em mais de 100 idiomas para permitir que tecnologias habilitadas para voz atendam a um conjunto diversificado de públicos em todo o mundo. Podemos trabalhar em projetos de qualquer escopo e tamanho; desde o licenciamento de conjuntos de dados de áudio prontos para uso, até o gerenciamento de coleta de dados de áudio personalizada, até a transcrição e anotação de áudio. Não importa o tamanho do seu projeto de coleta de dados de fala, podemos personalizar os serviços de coleta de áudio para atender às suas necessidades para criar conjuntos de dados de PNL de alta qualidade que visam dialetos, tons e idiomas. Escolha entre nossa ampla variedade de conjuntos de dados de fala e recursos de coleta de dados de áudio para configurações inteligentes que habilitam a voz.

Discurso Monólogo

Coleção de fala monólogo

Ele se concentra no processamento da fala de um único locutor. Utilize prompts com script para alimentar arquivos de áudio de canal único, garantindo a captura de padrões de fala, tons e nuances exclusivos, específicos para aquele indivíduo.

Discurso de Diálogo

Discurso de Diálogo
Coleção

Interação entre duas pessoas, replicando conversas e diálogos do mundo real com exposição multilíngue por meio de arquivos dual-channel e recursos transcritos.

Conversas multipartidárias

Grupo / Muti-partido
Conversas

Discussões com várias pessoas, capturando dinâmicas de grupo, sobreposições e tons variados para treinar modelos de fala com precisão.

Expressão de linguagem natural

Coleção de enunciados de linguagem natural

Treine IAs para identificar frases ou despertar palavras com significados semelhantes usando expressões diversas, ricas e autênticas para processamento e compreensão avançados de linguagem natural.

Fala Acústica

Dados acústicos
Coleção

Podemos gravar profissionalmente dados de áudio com qualidade de estúdio, seja em restaurantes, escritórios ou residências, ou de vários ambientes e idiomas, ao mesmo tempo que abrangemos uma faixa acústica mais ampla (Conjuntos de dados de som abrangentes).

Reconhecimento Automático de Fala

Reconhecimento Automático de Fala (ASR)

Melhore a precisão de seus sistemas de reconhecimento automático de fala (ASR) tendo acesso a conjuntos de dados de fala/áudio diversificados de última geração, de uma ampla variedade de dados demográficos.

Expressão de linguagem natural

Dados de treinamento de fala/áudio multilíngue

Nossos profissionais linguísticos qualificados, em todo o mundo, oferecem dados de áudio/fala multilíngues em vários idiomas e dialetos. Este esforço promove a comunicação global e ultrapassa as barreiras linguísticas, contribuindo para soluções de IA mais inclusivas e eficazes.

Assistentes virtuais digitais

Texto a Voz
(TTS)

Crie um modelo multilíngue de conversão de texto em fala (TTS) com a ajuda de nossa força de trabalho global, que ajuda você a coletar dados de fala em mais de 150 idiomas e dialetos para aprimorar seus modelos de IA, desde controles no carro até chatbots e soluções de aprendizagem com alta tecnologia. dados de áudio de qualidade.

Gravações de call center

Call Center
Gravações

Trocas genuínas entre agentes e clientes, com suporte a vários idiomas, como espanhol, alemão, inglês americano, bengali, japonês, chinês e hindi.

Histórias de sucesso

Conjuntos de dados de IA conversacional com mais de 3 mil horas de dados em 8 idiomas

Procurando construir uma plataforma multilíngue para idiomas indianos, o cliente fez parceria com a Shaip para coletar, segmentar e transcrever grandes conjuntos de dados em vários idiomas indianos. Isto ajudaria a desenvolver modelos de fala eficazes que poderiam impulsionar a nova plataforma inovadora do cliente.

Problema: Mais de 3,000 horas de dados de áudio coletados em 8 idiomas indianos, segmentados e transcritos para desenvolver reconhecimento automático de fala.

Alternativa? Fornecemos coleta de dados, segmentação, transcrição e entregamos arquivos JSON com metadados. Coletamos 3000 horas de dados de áudio em 8 idiomas indianos em grande escala para o projeto de tecnologia de fala do cliente.

Estudo de caso de coleta de dados de fala

Razões para escolher a Shaip como seu parceiro confiável de coleta de dados de fala

Pessoas

Pessoas

Equipes dedicadas e treinadas:

  • Mais de 30,000 colaboradores para criação de dados, rotulagem e controle de qualidade
  • Equipe de gerenciamento de projetos credenciada
  • Equipe de desenvolvimento de produto experiente
  • Equipe de integração e terceirização de pool de talentos
Extração

Extração

A mais alta eficiência do processo é garantida com:

  • Processo robusto 6 Sigma Stage-Gate
  • Uma equipe dedicada de black belts 6 Sigma - Principais proprietários de processos e conformidade de qualidade
  • Melhoria Contínua e Feedback Loop
Plataforma

Plataforma

A plataforma patenteada oferece benefícios:

  • Plataforma ponta a ponta baseada na web
  • Qualidade impecável
  • TAT mais rápido
  • Entrega perfeita

Conjuntos de dados de fala/áudio prontos para uso

Adicionar ao carrinhoConjunto de dados de idiomaTaxa de amostragemTipo de conjunto de dadosTotal de horas de áudioBreve DescriçãoDescrição do conjunto de dadosCanal de ÁudioPlataforma de GravaçãoNÓS SOMOS (%)Formato de áudioFormato de transcriçãoCaso de usoNúmero de falantesCTA
Discursoen_US_CC_8Vernácula afro-americanaVernácula afro-americanaen_USKHz 8Central de Atendimento211Dados vernaculares afro-americanos do call centerConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 612, Masculino: 1242 e Desconhecido: 12
Discursoen_US_MA_16Vernácula afro-americanaVernácula afro-americanaen_USKHz 16Áudio de mídia154Dados de mídia vernacular afro-americanaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 151, Masculino: 150 e Desconhecido: 10
DiscursoAfricâner_GC_8afrikaansafrikaansaf_ZAKHz 8Conversa Geral368Dados de conversação geral em africânerConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, africâner falado na ÁfricaDualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 502, Masculino: 390 e Desconhecido: 2
Discursoafricâner_MA_16afrikaansafrikaansaf_ZAKHz 16Áudio de mídia658Arquivos de mídia em africânerArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 750, Masculino: 1278 e Desconhecido: 52
DiscursoÁrabe_GC_8ArabeArabear_AEKHz 8Conversa Geral292Dados de conversação geral em árabeConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, árabe dos países do GolfoDualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 171, Masculino: 534 e Desconhecido: 1
DiscursoÁrabe_SM_48ArabeArabear-SAKHz 48Monólogo com script1,947Monólogo Script em ÁrabeGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 838 Masculino 1209 Desconhecido 78
DiscursoAssamês_CC_8AssameseAssamês (em Pipeline) como emCentral de Atendimento60Dados do call center assamês (em pipeline)Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoAssamês_GCAssameseAssamês (em Pipeline) como emConversa Geral100Dados de conversação geral assamês (em pipeline)Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoAssamês_MAAssameseAssamês (em Pipeline) como emÁudio de mídia40Dados de áudio de mídia Assamese (In Pipeline)Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoBengali_CC_8bengaliBengali (em pipeline) bn_INCentral de Atendimento60Bengali (In Pipeline) Dados de call-centerConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoBengali_GCbengaliBengali (em pipeline) bn_INConversa Geral100Bengali (In Pipeline) Dados de conversação geralConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoBengali_MAbengaliBengali (em pipeline) bn_INÁudio de mídia40Dados de áudio de mídia bengali (em pipeline)Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoBoston_CC_8Inglês de BostonInglês de Bostonen_USKHz 8Central de Atendimento177Dados do call center de BostonConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 605, Masculino: 711 e Desconhecido: 0
DiscursoBoston_GC_8Inglês de BostonInglês de Bostonen_USKHz 8Conversa Geral32Dados de conversas gerais de BostonConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 53, Masculino: 83 e Desconhecido: 0
DiscursoBoston_MA_16Inglês de BostonInglês de Bostonen_USKHz 16Áudio de mídia93Dados de áudio do Boston MediaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 43, Masculino: 181 e Desconhecido: 2
DiscursoCanadense_SM_48Francês canadenseFrancês canadensefr-CAKHz 48Monólogo com script1,222Francês canadenseGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 974 Masculino 631 Desconhecido 1
Discursochinês_CC_8Inglês chinêsInglês chinêsen_USKHz 8Central de Atendimento169Dados do call center chinêsConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 1790, Masculino: 523 e Desconhecido: 13
DiscursoChinês_MA_16Inglês chinêsInglês chinêsen_USKHz 16Áudio de mídia249Dados de áudio da mídia chinesaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 126, Masculino: 346 e Desconhecido: 6
DiscursoChinês Simplificado_SM_48Chinês SimplificadoChinês Simplificadozh-CNKHz 48Monólogo com script2,762Chinês SimplificadoGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1920 Masculino 1535 Desconhecido 270
DiscursoChinês Tradicional_SM_48Tradicional ChinesaTradicional Chinesazh-TWKHz 48Monólogo com script1,028Tradicional ChinesaGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1069 Masculino 262 Desconhecido 3
DiscursoDinamarquês_GC_8DinamarquêsDinamarquêsda_DKKHz 8Conversa Geral372Dados de conversação geral em dinamarquêsConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 311, Masculino: 417, Desconhecido: 0
DiscursoDinamarquês_MA_16DinamarquêsDinamarquêsda_DKKHz 16Áudio de mídia664dados de áudio da mídia dinamarquesaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino: 369, Masculino: 864, Desconhecido: 27
DiscursoDinamarquês_SM_48DinamarquêsDinamarquêsda-DKKHz 48Monólogo com script2,579Monólogo com roteiro dinamarquêsGravações de um único enunciado, que tendem a cair na faixa de 5 a 30 segundos, dinamarquês da DinamarcaMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1551 Masculino 1233 Desconhecido 42
DiscursoSul profundo inglês_CC_8Sul profundo inglêsSul profundo inglêsen_USKHz 8Central de Atendimento151Dados do centro de atendimento da English Deep SouthConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 221, Masculino 1004, Desconhecido 7
DiscursoSul profundo inglês_GC_8Sul profundo inglêsSul profundo inglêsen_USKHz 8Conversa Geral56Dados de conversação geral do inglês profundo do sulConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 99, Masculino 31, Desconhecido 0
DiscursoSul profundo inglês_MA_16Sul profundo inglêsSul profundo inglêsen_USKHz 16Áudio de mídia266Dados de áudio da English Deep South MediaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 204, Masculino 356, Desconhecido 21
DiscursoAlemão_CC_8AlemãoAlemãode-DeKHz 8Central de Atendimento64Dados do call center alemão Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,MonoComputador de mesa. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 478 Masculino 1440 Desconhecido 0
DiscursoAlemão_IVR_8AlemãoAlemãode-DeKHz 8 IVR200Dados de IVR da AlemanhaHumano para Máquina. Um tipo de fluxo IVR em que há um prompt TTS (por exemplo, "Como posso ajudá-lo") seguido por uma resposta humana espontâneaMonoComputador de mesa. Wav jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Feminino 10115 Masculino 8750 Desconhecido 0
DiscursoGuzerate_CC_8gujaratiGujarati (em pipeline) gu_INCentral de Atendimento60Gujarati (In Pipeline) Dados de call-centerConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoGujarati_GCgujaratiGujarati (em pipeline) gu_INConversa Geral100Gujarati (em pipeline) dados de conversação geralConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoGujarati_MAgujaratiGujarati (em pipeline) gu_INÁudio de mídia40Dados de áudio de mídia Gujarati (em pipeline)Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoHebraico_Conversação Geral_8HebraicoHebraicoele_ILKHz 8Conversa Geral399Dados de conversação geral em hebraicoConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, hebraico em IsraelDualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 414, Masculino 399, Desconhecido 1
DiscursoHebraico_MA_16HebraicoHebraicoele_ILKHz 16Áudio de mídia427Dados de áudio da mídia hebraicaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 361, Masculino 513, Desconhecido 13
DiscursoHindi_MA_16HindiHindioi_INKHz 16Áudio de mídia219Dados de áudio de mídia hindiArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 83, Masculino 309, Desconhecido 0
DiscursoHindi_SM_48HindiHindioi-INKHz 48Monólogo com script2,867Monólogo Script HindiGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1977 Masculino 1864 Desconhecido 147
DiscursoHINGLISH_CC_8HinglishHinglishhg_INKHz 8Central de Atendimento208HINGLISH Dados do call centerConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 822, Masculino 1262, Desconhecido 0
DiscursoHINGLISH_MA_16HinglishHinglishhg_INKHz 16Áudio de mídia216HINGLISH Dados de áudio de mídiaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 75, Masculino 380, Desconhecido 0
DiscursoHispânico_CC_8Inglês hispânicoInglês hispânicoen_USKHz 8Central de Atendimento212Dados hispânicos do call centerConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 822, Masculino 1262, Desconhecido 0
DiscursoHispânico_MA_16Inglês hispânicoInglês hispânicoen_USKHz 16Áudio de mídia155Áudio de mídia de chamada hispânicaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 140, Masculino 219, Desconhecido 5
DiscursoIndonésio_GC_8IndonésioIndonésioEu fizKHz 8Conversa Geral496Dados de conversação geral em indonésioConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, bahasa indonésioDualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 524, Masculino 454, Desconhecido 2
DiscursoIndonésio_MA_16IndonésioIndonésioEu fizKHz 16Áudio de mídia643Dados de áudio da mídia indonésiaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 746, Masculino 1507, Desconhecido 129
DiscursoIrlandês_GC_8IrlandêsIrlandêspt_IEKHz 8Conversa Geral192Dados de Conversação Geral IrlandesaConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 213, Masculino 153, Desconhecido 0
DiscursoJaponês_SM_48JaponêsJaponêsja-JPKHz 48Monólogo com script2,335Monólogo com roteiro japonêsGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1460 Masculino 1221 Desconhecido 194
DiscursoKannada_CC_8kannadaKannada (em pipeline) kn_INCentral de Atendimento60Dados do call center Kannada (em pipeline)Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoKannada_GCkannadaKannada (em pipeline) kn_INConversa Geral100Kannada (In Pipeline) Dados de conversação geralConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoKannada_MAkannadaKannada (em pipeline) kn_INÁudio de mídia40Kannada (In Pipeline) Dados de áudio de mídiaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoCoreano_CC_8CoreanaCoreanako_KRKHz 8Central de Atendimento107Dados do call center coreanoConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1086, Masculino 210, Desconhecido 4
DiscursoCoreano_MA_16CoreanaCoreanako_KRKHz 16Áudio de mídia204Dados de áudio da mídia coreanaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 70 Masculino 303, Desconhecido 25
DiscursoCoreano_SM_48CoreanaCoreanako-KRKHz 48Monólogo com script1,955Monólogo com roteiro coreanoGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1195 Masculino 1134 Desconhecido 122
Discursomalaio_GC_8MalayMalayms_MYKHz 8Conversa Geral266Dados de conversação geral em malaioConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, malaio na MalásiaDualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 316, Masculino 176, Desconhecido 0
Discursomalaio_MA_16MalayMalayms_MYKHz 16Áudio de mídia344Dados de áudio da mídia malaiaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 236, Masculino 626, Desconhecido 47
DiscursoMalaiala_CC_8malayalamMalayalam (em Pipeline) ml_INCentral de Atendimento60Malayalam (In Pipeline) Dados de call-centerConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoMalaiala_GCmalayalamMalayalam (em Pipeline) ml_INConversa Geral100Malayalam (In Pipeline) Dados de conversação geralConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoMalaiala_MAmalayalamMalayalam (em Pipeline) ml_INÁudio de mídia40Malayalam (In Pipeline) Dados de áudio de mídiaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoMarathi_CC_8marataMarathi (em pipeline) senhor_INCentral de Atendimento60Dados do call center Marathi (em pipeline)Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoMarathi_GCmarataMarathi (em pipeline) senhor_INConversa Geral100Marathi (em pipeline) dados de conversação geralConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoMarathi_MAmarataMarathi (em pipeline) senhor_INÁudio de mídia40Dados de áudio de mídia Marathi (em pipeline)Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoMexicano_SM_48Espanhol (México)Espanhol (México)es-MXKHz 48Monólogo com script1,492Monólogo com roteiro em espanhol mexicanoGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1016 Masculino 1069 Desconhecido 95
DiscursoHolanda_SM_48NeerlandêsNeerlandêspt-BRKHz 48Monólogo com script1,205Monólogo Script HolandêsGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1285 Masculino 531 Desconhecido 3
DiscursoNova York English_CC_8Inglês de Nova YorkInglês de Nova Yorken_USKHz 8Central de Atendimento103Dados do call center em inglês de Nova YorkConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 610, Masculino 532, Desconhecido 0
DiscursoNova York English_GC_8Inglês de Nova YorkInglês de Nova Yorken_USKHz 8Conversa Geral107Dados de conversação geral em inglês de Nova YorkConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 118, Masculino 114, Desconhecido 0
DiscursoNova York English_MA_16Inglês de Nova YorkInglês de Nova Yorken_USKHz 16Áudio de mídia140Dados de áudio do New York English MediaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 66, Masculino 230, Desconhecido 11
DiscursoNova Zelândia_GC_8Nova Zelândia Inglês Nova Zelândia Inglês en_NZKHz 8Conversa Geral148Dados de conversação geral em inglês da Nova ZelândiaConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 167, masculino 121, Desconhecido 4
DiscursoNova Zelândia_MA_16Nova Zelândia Inglês Nova Zelândia Inglês en_NZKHz 16Áudio de mídia400Áudio de mídia em inglês da Nova ZelândiaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 367, masculino 678, Desconhecido 26
DiscursoOriya_CC_8OriyaOriya (Em Pipeline) ou_INCentral de Atendimento60Oriya (In Pipeline) Dados do Call-CenterConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoOriya_GCOriyaOriya (Em Pipeline) ou_INConversa Geral100Oriya (In Pipeline) Dados de conversação geralConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoOriya_MAOriyaOriya (Em Pipeline) ou_INÁudio de mídia40Oriya (In Pipeline) Dados de áudio de mídiaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoPolonês_MA_16PolacoPolacopl_PLKHz 16Áudio de mídia269Áudio da mídia polonesaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 173 Masculino 354 Desconhecido 6
DiscursoPolônia Polonesa_SM_48Polonês (Polônia)Polonês (Polônia)pl-PLKHz 48Monólogo com script1,482Polônia polonesa - monólogo com roteiroGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1324 Masculino 701 Desconhecido 24
DiscursoPunjabi_CC_8PunjabiPunjabi (em pipeline) PunjabiCentral de Atendimento60Punjabi (In Pipeline) Dados de call-centerConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoPunjabi_GCPunjabiPunjabi (em pipeline) PunjabiConversa Geral100Punjabi (In Pipeline) Dados de conversação geralConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoPunjabi_MAPunjabiPunjabi (em pipeline) Punjabi Áudio de mídia40Punjabi (In Pipeline) Dados de áudio de mídiaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoRusso_SM_48RussoRussoru-RUKHz 48Monólogo com script2,398Monólogo com roteiro russoGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1689 Masculino 1937 Desconhecido 214
DiscursoEscocês_GC_8escocês (sotaque inglês)escocês (sotaque inglês)pt_ABKHz 8Conversa Geral292Dados de Conversação Geral EscocesaConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 285, Masculino 260, Desconhecido 3
DiscursoCingapura_CC_8Singapura InglêsSingapura Inglêspt_SGKHz 8Central de Atendimento218Dados do call center de CingapuraConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 2139, Masculino 884, Desconhecido 21
DiscursoSingapura_MA_16Singapura InglêsSingapura Inglêspt_SGKHz 16Áudio de mídia247Dados de áudio da Singapore MediaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 160, Masculino 455, Desconhecido 37
DiscursoInglês sul-africano_CC_8Inglês sul-africanoInglês sul-africanopt_ZAKHz 8Central de Atendimento261Dados da central de atendimento em inglês da África do SulConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1274, Masculino 935, Desconhecido 1
DiscursoInglês sul-africano_MA_16Inglês sul-africanoInglês sul-africanopt_ZAKHz 16Áudio de mídia251Dados de áudio da mídia inglesa da África do SulArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 235, Masculino 432, Desconhecido 36
DiscursoSuaíli_CC_8swahiliswahilisw_KEKHz 8Central de Atendimento230dados Swahili Call-CenterConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 611, Masculino 833, Desconhecido 0
DiscursoSuaíli_MA_16swahiliswahilisw_KEKHz 16Áudio de mídia265dados de áudio Swahili MediaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 118, Masculino 493, Desconhecido 25
DiscursoSueco_CC_8SuecoSuecosv_SEKHz 8Central de Atendimento250Dados do call center suecoConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1581, masculino 727, Desconhecido 2
DiscursoSueco_MA_16SuecoSuecosv_SEKHz 16Áudio de mídia278Dados de áudio da mídia suecaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 195, masculino 500, Desconhecido 21
DiscursoTâmil_CC_8tâmilTâmil (em pipeline) ta_INCentral de Atendimento60Dados de call center tâmil (em pipeline)Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoTamil_GCtâmilTâmil (em pipeline) ta_INConversa Geral100Dados de conversação geral em tâmil (em pipeline)Conversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoTamil_MAtâmil Tâmil (em pipeline) ta_INÁudio de mídia40Dados de áudio de mídia tâmil (em pipeline)Arquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoTelugu_GC_8telugutelugute_INKHz 8Conversa Geral553Dados de conversas gerais em télugoConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do áudio (intervalo) - 15-60 minutos, DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 574, Masculino 564, Desconhecido 0
DiscursoTelugu_MA_16telugutelugute_INKHz 16Áudio de mídia648Dados de áudio da Telugu MediaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 207, Masculino 963, Desconhecido 2
DiscursoTelugu_CC_8teluguTélugo (em pipeline) te_INCentral de Atendimento30Telugu (In Pipeline) Dados de call-centerConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoTelugu_GCteluguTélugo (em pipeline) te_INConversa Geral50Telugu (In Pipeline) Dados de conversação geralConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,Computador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoTelugu_MAteluguTélugo (em pipeline) te_INÁudio de mídia20Telugu (In Pipeline) Dados de áudio de mídiaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
DiscursoTailandês_GC_8TailandêsTailandêsth_THKHz 8Conversa Geral183Conversa Geral TailandesaConversa telefônica sem script entre duas pessoas. Aproximadamente. Duração do Áudio (Intervalo) - 15-60 minutos, Um registro informal usado entre amigosDualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 338, Masculino 96, Desconhecido 8
DiscursoTailandês_MA_8TailandêsTailandêsth_THKHz 16Áudio de mídia173áudio da mídia tailandesaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 143, Masculino 502, Desconhecido 26
DiscursoTurco Turquia_SM_48Turquia turcaTurquia turcatr-TRKHz 48Monólogo com script2,027Turquia turcaGravações de um único enunciado, que tendem a cair no intervalo de 5 a 30 segundosMonoMobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 1561 Masculino 1241 Desconhecido 31
Discursovietnamita_GC_8VietnamitaVietnamitavi_VNKHz 8Conversa Geral295Dados de conversação geral vietnamitaConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos, norte (por exemplo, Hanói), central e sul (por exemplo, cidade de Ho Chi Minh).DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 400, masculino 380, Desconhecidos 2
Discursovietnamita_MA_16VietnamitaVietnamitavi_VNKHz 16Áudio de mídia257Dados de áudio da mídia vietnamitaArquivos de áudio/vídeo de domínio público licenciáveis, como entrevistas, podcasts, etc. - 1 a 5 pessoas. Aproximadamente. Duração do áudio (intervalo) 15-60 minutosMonoFornecimento da Web5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 249, masculino 200, Desconhecidos 45
Discursogalês_GC_8galês (sotaque inglês)galês (sotaque inglês)pt_WLKHz 8Conversa Geral278Dados de Conversação Geral do País de GalesConversa telefónica sintética sem script entre "agente" e "cliente", Aprox. Duração do áudio (intervalo) 5-15 minutos,DualComputador de mesa5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingFeminino 270, Masculino 324, Desconhecido 0
DiscursoInglês do Reino Unido_WW_16Inglês do Reino UnidoInglês do Reino Unidoen_ukKHz 16Palavra de DespertarSpeakers 200Wake Word Inglês do Reino Unidocoleção de frases-chave de dados
  • alto-falantes 200
  • 4 frases-chave exclusivas por palestrante
  • 25-30 gravações repetidas de frases-chave por frase-chave única
  • 25-30 arquivos de áudio por frase-chave única
  • Total de 120 declarações gravadas por locutor
canaleta 1Mobile App5.0. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSexo: 50% masculino, 50% feminino, +/- 10%.

Serviços oferecidos

A coleta de dados de áudio especializada não é prática para configurações abrangentes de IA. Na Shaip, você pode até considerar os seguintes serviços para tornar os modelos muito mais difundidos do que o habitual:

Coleta de Dados de Texto

Coleta de Dados de Texto
Serviços

O verdadeiro valor dos serviços de coleta de dados cognitivos da Shaip é que eles fornecem às organizações a chave para desbloquear informações críticas encontradas em dados não estruturados

Coleta de dados de imagem

Serviços de coleta de dados de imagens

Certifique-se de que seu modelo de visão computacional identifique cada imagem com precisão, para treinar perfeitamente os modelos de IA de última geração do futuro

Coleta de dados de vídeo

Serviços de coleta de dados de vídeo

Agora concentre-se na visão computacional junto com a PNL para treinar seus modelos para identificar objetos, indivíduos, impedimentos e outros elementos visuais com perfeição

Shaip Fale Conosco

Quer construir seu próprio conjunto de dados de áudio?

Conecte-se com nosso especialista interno em coleta de dados de fala para configurar um repositório de áudio que melhor atenda às suas necessidades

  • Ao me registrar, concordo com Shaip Política de Privacidade e Termos de Serviço e fornecer meu consentimento para receber comunicações de marketing B2B da Shaip.

A coleta de dados de fala para um modelo de ML refere-se ao processo de coleta de gravações de áudio da linguagem falada. Esta coleção auxilia no treinamento e no refinamento de algoritmos de aprendizado de máquina, principalmente aqueles centrados na compreensão e processamento de vozes humanas.

Ao coletar dados de áudio para Reconhecimento Automático de Fala (ASR), você deve começar definindo as necessidades específicas do seu projeto, incluindo o idioma, sotaque e tipo de fala desejados. Após definir esses parâmetros, certifique-se de obter todas as permissões necessárias para respeitar a privacidade do usuário. Em seguida, use dispositivos de gravação ou software apropriados para capturar amostras de áudio nítidas. Cada gravação deve ser meticulosamente anotada com sua transcrição ou outros metadados pertinentes e armazenada sistematicamente para acesso fácil.

Um conjunto de dados de fala em aprendizado de máquina é fundamental para treinar, testar e validar modelos adaptados para reconhecer, transcrever ou interpretar a linguagem falada. Esses conjuntos de dados abrem caminho para uma infinidade de aplicações, desde assistentes de voz e serviços de transcrição até biometria de voz.

Para recolher dados precisos de diversas línguas e sotaques, é vital a colaboração com falantes nativos das origens linguísticas desejadas. Procure obter uma amostra variada e representativa para cobrir um amplo espectro de nuances demográficas. Empregue equipamentos de gravação padronizados em ambientes uniformes para garantir a consistência do áudio. E o mais importante, anote cada dado com transcrições e metadados detalhados, denotando o idioma e o sotaque específicos.