Agora pegue 50% DE DESCONTO* em conjuntos de dados prontos para uso de IA conversacional

Conjunto de dados de fala e áudio para chatbots, assistentes de voz, dispositivos habilitados para fala.

*Oferta por período limitado

  • Ao me registrar, concordo com Shaip Política de Privacidade e Termos de Serviço e fornecer meu consentimento para receber comunicações de marketing B2B da Shaip.

Aprovado pelos líderes da indústria

Adicionar ao carrinhoConjunto de dados de idioma pronto para usoConversas de Call Center 8khz*Conversas Genéricas 8kHz*Mídia e podcasts 16khz*Enunciado/Monólogo Scripted 16khz*Volume total em horasDialetos cobertosFormato de áudioFormato de transcrição de textoCaso de usofonteCTA
DiscursoafrikaansConjunto de dados de áudio em africâner6009001500Afrikaans falado na África. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoArabeConjunto de dados de áudio árabe80015002300Árabe dos países do Golfo. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoChinêsConjunto de dados de áudio chinês20002000chinês da china. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoDinamarquêsConjunto de dados de áudio dinamarquês40060020003000Dinamarquês da Dinamarca. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoNeerlandêsConjunto de dados de áudio holandês20002000Holandês da Holanda. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - Acento AAVEInglês - Conjunto de dados de áudio AAVE (inglês vernacular afro-americano)5005001000A variedade vernacular (às vezes conhecida como AAVE, normalmente falada pela grande maioria dos afro-americanos de classe média e trabalhadora) e a variedade mais padrão (tipicamente falada por afro-americanos de classe média em situações formais e públicas), mas com uma ênfase mais forte no vernáculo.. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - Sotaque Boston/Nova YorkInglês - Conjunto de dados de áudio de Boston/Nova York225225350800Esta é uma coleção de vários sotaques regionais falados em torno das cidades de Boston, Nova York e Filadélfia. Esses sotaques podem soar semelhantes aos de não-locais, mas distintos de outros sotaques americanos. Apesar de algum vocabulário local diferente de outras partes do mundo de língua inglesa, esses sotaques são mutuamente inteligíveis com o inglês falado em outros lugares.. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - sotaque chinêsInglês - Conjunto de dados de áudio com sotaque chinês150300450Falantes que falam chinês como primeira língua e que se mudaram/imigraram para os Estados Unidos quando adolescentes/adultos e aprenderam inglês como segunda língua.. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - Sotaque do Sul ProfundoInglês - Conjunto de dados de áudio do Deep South2752754501000Palestrantes de (i) Texas; (ii) Carolina do Norte, Carolina do Sul, Geórgia; (iii) Nova Orleans; (iv) Panhandle da Flórida; (v) Tennessee, Arkansas, Michigan.. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - sotaque hispânicoInglês - Conjunto de dados de áudio com sotaque hispânico400400800O inglês hispânico refere-se às variedades de inglês dos EUA faladas por hispano-americanos de diversas heranças nacionais. O foco principal foi em mexicanos-americanos, falantes de diferentes origens nacionais (por exemplo, México, Porto Rico, República Dominicana, Equador, Cuba, etc.) e de diferentes regiões (por exemplo, Califórnia, Nova York, Flórida). Os oradores incluídos foram que falam espanhol como primeira língua, bem como falantes de origem hispânica que falam espanhol tem uma língua de herança.. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - Sotaque da Nova ZelândiaInglês - Conjunto de dados de áudio da Nova Zelândia2507501000Falantes em ambas as ilhas, incluindo uma mistura de falantes mais jovens (<40 anos) e falantes mais velhos (>40 anos) em proporções iguais.. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - Sotaque de CingapuraInglês - Conjunto de dados de áudio de Cingapura4006001000Tanto o inglês padrão de Cingapura quanto o inglês coloquial de Cingapura. cingapurianos de diferentes origens étnicas (por exemplo, chineses, malaios, indianos, etc.) e de diferentes níveis educacionais.. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - Sotaque da África do SulInglês - Conjunto de dados de áudio da África do Sul4006001000Representantes de várias classes socioeconômicas e origens etnológicas (por exemplo, sul-africanos de origem europeia, africana, indiana ou mista).. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - sotaque irlandêsInglês - conjunto de dados de áudio irlandês500500Inglês falado na Irlanda. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - sotaque escocêsInglês - Conjunto de dados de áudio escocês800800Inglês falado por escoceses. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglês - sotaque galêsInglês - Conjunto de dados de áudio galês800800Inglês galês. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoFranco-canadenseConjunto de dados de áudio francês canadense10001000Francês canadense. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoHebraicoConjunto de dados de áudio hebraico7507501500hebraico em Israel. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoIndonésioConjunto de dados de áudio da Indonésia100010002000Bahasa indonésio. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoJaponêsConjunto de dados de áudio japonês20002000Japonês do Japão. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoCoreanaConjunto de dados de áudio coreano10020015001800Palestrantes espalhados por toda a Coreia do Sul.. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoMalayConjunto de dados de áudio malaio5005001000Malaio na Malásia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoEspanhol mexicanoConjunto de dados de áudio espanhol mexicano12501250Mexicano do México. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoPolacoConjunto de dados de áudio polonês25020002250polonês da Polônia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoRussoConjunto de dados de áudio russo20002000russo da Rússia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoswahiliConjunto de dados de áudio suaíli3506501000Suaíli sul-africano e queniano. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoSuecoConjunto de dados de áudio sueco3506501000Sueco na Suécia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoChinês de TaiwanConjunto de dados de áudio chinês de Taiwan10001000Chinês de Taiwan. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoTailandêsConjunto de dados de áudio tailandês350450800Um registro informal usado entre amigos,. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoTurcoConjunto de dados de áudio turco20002000turco da Turquia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoVietnamitaConjunto de dados de áudio vietnamita6004001000Norte (por exemplo, Hanói), Central e Sul (por exemplo, Ho Chi Minh City).. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoHindiConjunto de dados de áudio hindi80020002800Hindi na Índia especificamente nas regiões Norte, Leste e Oeste. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoHinglishConjunto de dados de áudio em inglês indiano300500800Coletado de cidades urbanas indianas que são centros financeiros do país devido às crescentes oportunidades econômicas. Esses lugares podem ser Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad, etc.. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoInglêsConjunto de dados de áudio em inglês700700. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursokannadaConjunto de dados de áudio Kannada6010040200Kannada de Karnataka, Índia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursomalayalamConjunto de dados de áudio malaiala6010040200Malayalam de Kerala, Lakshadweep e Puducherry. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoOriyaConjunto de dados de áudio Oriya6010040200Oriya de partes de Odisha, Bengala Ocidental, Jharkhand e Chhattisgarh. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoPunjabiConjunto de dados de áudio de Punjabi6010040200Punjabi de Punjab, Índia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursotâmilConjunto de dados de áudio em tâmil60100240400Tamil de Tamil Nadu, Índia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoteluguConjunto de dados de áudio Telugu1009509502000Telugu de Andhra Pradesh, Índia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursobengaliConjunto de dados de áudio bengali6010040200Bengali de Bengala Ocidental, Índia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursogujaratiConjunto de dados de áudio guzerate6010040200Gujarati de Gujarat, Índia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursomarataConjunto de dados de áudio Marathi6010040200Marathi de Maharashtra, Índia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
DiscursoAssameseConjunto de dados de áudio assamês6010040200Assamese de Asssam, Índia. WavjsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip

Profundo conhecimento em IA de conversação

Conversational AI ou Chatbots ou Virtual / Digital Assistants são tão inteligentes quanto a tecnologia e os dados por trás deles. Na Shaip, oferecemos a você um amplo conjunto de dados de áudio diversificados para processamento de linguagem natural (NLP) que imita conversas com pessoas reais que permitem dar vida à sua IA. Com nosso profundo conhecimento, ajudamos você a criar e localizar modelos de fala habilitados para IA, com a máxima precisão, com conjuntos de dados ricos e estruturados em vários idiomas de todo o mundo. Oferecemos serviços de coleta de áudio multilíngue, transcrição de áudio e anotação de áudio com base em sua necessidade, ao mesmo tempo em que personalizamos totalmente a intenção, os enunciados e a distribuição demográfica desejados.

Coleta de fala com script

Coleta de fala espontânea

Transcrição de dados de áudio

Rotulagem e anotação de dados

O Shaip permite que você treine com precisão a sua Conversational AI Platform para que ela possa:

  • Fale, envie mensagens de texto e converse perfeitamente em vários canais.
  • Aprenda com as interações existentes na forma de bate-papo, transcrições de voz, transações etc. e sugira e converse com base nesses aprendizados.
  • Entenda a intenção por trás da fala humana e remova a ambiguidade na compreensão da linguagem humana.
  • Interage com você individualmente e pode ser treinado para identificar usuários e lembrar de conversas anteriores.

Um líder mundial em dados de treinamento de IA de conversação

Horas de dados de áudio em mais de 100 idiomas – Originados, transcritos e anotados

Licenciamento de dados de fala

Mais de 20 mil horas de dados de fala em mais de 40 idiomas e dialetos, abrangendo mais de 55 tópicos de diferentes domínios, como Call-center, debates, conversas gerais, discursos, podcasts, etc.

Coleta de dados de fala

Colete dados de áudio e fala (monólogo, conversa de 2 pessoas, bate-papo humano-bot) em mais de 100 idiomas de todo o mundo, personalizados de acordo com seus requisitos de IA.

Transcrição de dados de fala

Transcrição de áudio ou anotação de áudio econômica por meio de uma forte força de trabalho de 30,000 colaboradores com TAT, precisão e economia garantidos

Acelere o desenvolvimento de seu aplicativo Conversational AI com Audio Collection e Audio Annotation Services

A Vantagem Shaip

Escala​

Podemos fornecer, dimensionar e fornecer dados de áudio de todo o mundo em vários idiomas e dialetos com base em seus requisitos.

Perícia

Temos a experiência certa em relação à coleta de dados precisa e imparcial, transcrição e anotação padrão-ouro.

Network

Uma rede de mais de 30,000 colaboradores qualificados, que podem receber rapidamente tarefas de coleta de dados para criar modelos de treinamento de IA e serviços de expansão.

Equipar

Temos uma plataforma totalmente baseada em IA com ferramentas e processos proprietários para alavancar o gerenciamento de fluxo de trabalho 24 horas por dia, 7 dias por semana.

Agilidade

Nós nos adaptamos às mudanças nos requisitos do cliente muito rapidamente e ajudamos a acelerar o desenvolvimento de IA com dados de fala de qualidade 5 a 10 vezes mais rápido que a concorrência.

Segurança

Damos a máxima importância à segurança e privacidade dos dados e também somos certificados para lidar com dados confidenciais altamente regulamentados.

O que fazemos de melhor

Dados de treinamento

Obtenha dados rotulados da mais alta qualidade em uma fração do tempo. É padrão-ouro, confiável e pronto para treinar seus modelos de IA e ML para atingir os mais altos níveis de desempenho.

Saber Mais​

Coleta de dados, rotulagem e anotação

Com a Shaip, você obtém mais de 15 anos de experiência comprovada na coleta, transcrição e anotação de dados de qualidade. Com nossa força de trabalho global, podemos coletar dados de todo o mundo e fornecer serviços de rotulagem e anotação com a quantidade perfeita de nível de habilidade e experiência necessária para seus dados.

Saber Mais​

Catálogos de dados e licenciamento

Com nosso vasto inventário de milhões de conjuntos de dados, você pode coletar e organizar conforme necessário. Podemos então licenciar esses dados de qualidade para seus requisitos específicos de uso de IA e ML. Além disso, esses dados estão disponíveis por uma fração do custo se você os criasse sozinho.

Saber Mais​

Quer construir seu próprio conjunto de dados?

Entre em contato conosco agora para saber como podemos coletar um conjunto de dados personalizado para sua solução exclusiva de IA.