Impacto da diversidade nos dados de treinamento

Diversos dados de treinamento de IA para inclusão e eliminação de viés

A Inteligência Artificial e o Big Data têm o potencial de encontrar soluções para problemas globais, priorizando questões locais e transformando o mundo de várias maneiras profundas. A IA traz soluções para todos – e em todos os ambientes, de residências a locais de trabalho. Computadores de IA, com Machine Learning treinamento, pode simular comportamentos e conversas inteligentes de maneira automatizada e personalizada.

No entanto, a IA enfrenta um problema de inclusão e costuma ser tendenciosa. Felizmente, focando ética da inteligência artificial pode introduzir novas possibilidades em termos de diversificação e inclusão, eliminando preconceitos inconscientes por meio de diversos dados de treinamento.

Importância da diversidade nos dados de treinamento de IA

Diversidade de dados de treinamento de IA A diversidade e a qualidade dos dados de treinamento estão relacionadas, pois uma afeta a outra e impacta o resultado da solução de IA. O sucesso da solução de IA depende da dados diversos é treinado. A diversidade de dados evita o overfitting da IA, o que significa que o modelo executa ou aprende apenas com os dados usados ​​para treinar. Com overfitting, o modelo AI não pode fornecer resultados quando testado em dados não usados ​​no treinamento.

O estado atual do treinamento de IA dados,

A desigualdade ou falta de diversidade nos dados levaria a soluções de IA injustas, antiéticas e não inclusivas que poderiam aprofundar a discriminação. Mas como e por que a diversidade de dados está relacionada às soluções de IA?

A representação desigual de todas as classes leva à identificação incorreta de rostos – um caso importante é o Google Fotos, que classificou um casal negro como 'gorilas'. E Meta pergunta a um usuário assistindo a um vídeo de homens negros se o usuário gostaria de 'continuar assistindo a vídeos de primatas'.

Por exemplo, a classificação imprecisa ou imprópria de minorias étnicas ou raciais, especialmente em chatbots, pode resultar em prejuízo nos sistemas de treinamento de IA. De acordo com o relatório de 2019 sobre Sistemas discriminatórios – gênero, raça, poder na IA, mais de 80% dos professores de IA são homens; mulheres pesquisadoras de IA no FB constituem apenas 15% e 10% no Google.

O impacto de diversos dados de treinamento no desempenho da IA

Impacto da diversidade nos dados de treinamento Deixar de fora grupos e comunidades específicos da representação de dados pode levar a algoritmos distorcidos.

O viés de dados é frequentemente introduzido acidentalmente nos sistemas de dados – por subamostragem de certas raças ou grupos. Quando os sistemas de reconhecimento facial são treinados em diversas faces, isso ajuda o modelo a identificar características específicas, como a posição dos órgãos faciais e variações de cores.

Outro resultado de ter uma frequência de rótulos desbalanceada é que o sistema pode considerar uma minoria como uma anomalia quando pressurizada para produzir uma saída em um curto período de tempo.

Vamos discutir seu requisito de dados de treinamento de IA hoje.

Alcançando diversidade em dados de treinamento de IA

Por outro lado, gerar um conjunto de dados diversificado também é um desafio. A absoluta falta de dados sobre certas classes pode levar à sub-representação. Isso pode ser mitigado tornando as equipes de desenvolvedores de IA mais diversificadas em relação a habilidades, etnia, raça, gênero, disciplina e muito mais. Além disso, a maneira ideal de abordar os problemas de diversidade de dados na IA é enfrentá-los desde o início, em vez de tentar consertar o que está feito – infundindo diversidade na fase de coleta e curadoria de dados.

Independentemente do hype em torno da IA, ela ainda depende dos dados coletados, selecionados e treinados por humanos. O viés inato nos humanos se refletirá nos dados coletados por eles, e esse viés inconsciente também se insinua nos modelos de ML. 

Etapas para coletar e selecionar diversos dados de treinamento

Inclusão de diversidade de dados de treinamento

Diversidade de dados pode ser alcançado por:

  • Adicione cuidadosamente mais dados de classes sub-representadas e exponha seus modelos a pontos de dados variados. 
  • Coletando dados de diferentes fontes de dados. 
  • Por aumento de dados ou manipulação artificial de conjuntos de dados para aumentar/incluir novos pontos de dados distintamente diferentes dos pontos de dados originais. 
  • Ao contratar candidatos para o processo de desenvolvimento de IA, remova todas as informações irrelevantes do aplicativo. 
  • Melhorar a transparência e a responsabilidade melhorando a documentação do desenvolvimento e avaliação de modelos. 
  • Introduzindo regulamentos para construir diversidade e inclusão na IA sistemas desde o nível de base. Vários governos desenvolveram diretrizes para garantir a diversidade e mitigar o viés da IA ​​que pode gerar resultados injustos. 

[Leia também: Saiba mais sobre o processo de coleta de dados de treinamento de IA ]

Conclusão

Atualmente, apenas algumas grandes empresas de tecnologia e centros de aprendizagem estão exclusivamente envolvidos no desenvolvimento de soluções de IA. Esses espaços de elite estão impregnados de exclusão, discriminação e preconceito. No entanto, esses são os espaços onde a IA está sendo desenvolvida, e a lógica por trás desses sistemas avançados de IA está repleta do mesmo viés, discriminação e exclusão suportados pelos grupos sub-representados. 

Ao discutir a diversidade e a não discriminação, é importante questionar as pessoas que beneficia e as que prejudica. Também devemos observar quem ela coloca em desvantagem – ao forçar a ideia de uma pessoa 'normal', a IA poderia potencialmente colocar 'outros' em risco. 

Discutir a diversidade nos dados de IA sem reconhecer as relações de poder, equidade e justiça não mostrará o quadro geral. Para entender completamente o escopo da diversidade nos dados de treinamento de IA e como humanos e IA podem juntos mitigar essa crise, entre em contato com os engenheiros da Shaip. Temos diversos engenheiros de IA que podem fornecer dados dinâmicos e diversificados para suas soluções de IA. 

Ações Sociais