Cadeia de Pensamento

Cadeia de Pensamento – Tudo o que Você Precisa Saber Sobre Isso

A resolução de problemas tem sido uma das capacidades inatas dos humanos. Desde os nossos dias primitivos, quando nossos maiores desafios na vida eram não sermos comidos por uma fera predadora, até os tempos contemporâneos para receber algo em casa rapidamente, temos combinado nossa criatividade, raciocínio lógico e inteligência para chegar a resoluções para conflitos.

Agora, enquanto testemunhamos a gênese dos sencientes de IA, enfrentamos novos desafios com relação às suas capacidades de tomada de decisão. Enquanto a década anterior foi toda sobre celebrar as possibilidades e o potencial dos modelos e aplicações de IA, esta década é sobre dar um passo além – questionar a legitimidade das decisões tomadas por tais modelos e deduzir o raciocínio por trás delas.

À medida que a inteligência artificial explicável (XAI) ganha mais destaque, este é o momento de discutir um conceito-chave no desenvolvimento de modelos de IA que chamamos Sugestão de Cadeia de Pensamento. Neste artigo, decodificaremos e desmistificaremos extensivamente o que isso significa e termos simples.

O que é o estímulo da cadeia de pensamento?

Quando a mente humana está preparada com um desafio ou um problema complexo, ela naturalmente tenta dividi-lo em fragmentos de etapas sequenciais menores. Motivada pela lógica, a mente estabelece conexões e simula cenários de causa e efeito para criar estratégias para a melhor resolução possível para o desafio.

O processo de replicação disso em um modelo ou sistema de IA é Solicitação de cadeia de pensamento.

Como o nome sugere, um modelo de IA gera uma série ou uma cadeia de pensamentos lógicos (ou etapas) para abordar uma consulta ou conflito. Visualize isso como dar uma instrução passo a passo para alguém pedindo uma rota para um destino.

Esta é a técnica predominante implantada nos modelos de raciocínio da OpenAI. Como eles são projetados para pensar antes de gerar uma resposta ou uma resposta, eles foram capazes de decifrar exames competitivos feitos por humanos.

[Leia também: Tudo o que você precisa saber sobre LLM]

Benefícios da solicitação de cadeia de pensamento

Qualquer coisa que seja orientada pela lógica produz uma vantagem significativa. Da mesma forma, modelos treinados em prompts de cadeia de pensamento oferecem não apenas precisão e relevância, mas uma gama diversificada de benefícios, incluindo:

Eficiência Solução de problemas capacidades, onde sua importância é crítica em áreas como saúde e finanças. LLMs que implementam o prompting de cadeia de pensamento entendem melhor os desafios explícitos e subjacentes e geram respostas após considerar probabilidades distintas e cenários de pior caso.

Mitigante suposições e resultados gerados a partir de suposições porque os modelos aplicam pensamento e processamento lógico e sequencial para concluir, em vez de tirar conclusões precipitadas.

Aumento versatilidade. pois os modelos não precisam ser treinados rigorosamente em um novo caso de uso, pois eles seguem a lógica e não o propósito.

Estratégias coerência em tarefas que envolvem respostas multifacetadas/multipartes. 

Anatomia do funcionamento da técnica de estímulo da cadeia de pensamento

Se você estiver familiarizado com a arquitetura de software monolítica, saberá que todo o aplicativo de software é desenvolvido como uma única unidade coerente. A simplificação de um imposto tão complexo chegou com o método de arquitetura de microsserviços que envolveu a divisão do software em serviços independentes. Isso resultou em desenvolvimento mais rápido de produtos e funcionalidade perfeita também.

Solicitação de CoT em IA é similar, onde os LLMs são guiados por uma série de processos sequenciais de raciocínio para gerar uma resposta. Isso é feito por meio de:

  • Instruções explícitas, onde os modelos são instruídos diretamente a abordar um problema sequencialmente por meio de comandos simples.
  • A instrução implícita é mais sutil e matizada em sua abordagem. Nisso, um modelo é levado pela lógica de uma tarefa similar e alavanca suas capacidades de inferência e compreensão para replicar a lógica para seus problemas apresentados.
  • Exemplos demonstrativos, onde um modelo apresentaria o raciocínio passo a passo e geraria insights incrementais para resolver um problema.

3 casos reais em que o CoT Prompting é usado

Modelos de decisão financeira

Modelos de decisão financeira

CoT multimodal em bots

Berço multimodal em bots

Serviço de Saúde

Serviço de saúde

Neste setor altamente volátil, o CoT prompting pode ser usado para entender a trajetória financeira potencial de uma empresa, conduzir avaliações de risco de solicitantes de crédito e muito mais.Chatbots que são desenvolvidos e implantados para empresas demandam funcionalidades de nicho. Eles precisam demonstrar habilidades em entender diferentes formatos de entradas. O CoT prompting funciona melhor em tais casos, onde os bots precisam combinar prompts de texto e imagem para gerar respostas para consultas.Desde o diagnóstico de pacientes a partir de dados de saúde até a geração de planos de tratamento personalizados para pacientes, o prompt de CoT pode complementar as metas de saúde de clínicas e hospitais.

Exemplo

Consulta do cliente: Notei uma transação na minha conta que não reconheço, meu cartão de débito foi perdido e quero configurar alertas para as transações da minha conta. Você pode me ajudar com esses problemas?

Etapa 1: Identifique e categorize os problemas

  • Transação não reconhecida.
  • Cartão de débito perdido.
  • Configurando alertas de transação.

Etapa 2: Abordar a transação não reconhecida

Peça detalhes: Você poderia fornecer a data e o valor da transação?

  • Filial 1: Se forem fornecidos detalhes:
    • Revise a transação. Se for fraudulenta, pergunte se o cliente quer contestá-la.
  • Filial 2: Se não houver detalhes:
    • Ofereça-se para fornecer uma lista de transações recentes.

Etapa 3: resolva o problema do cartão de débito perdido

Congelar o cartão: Recomenda-se o congelamento imediato.

  • Filial 1: Se o cliente concordar:
    • Congele o cartão e pergunte se eles querem uma substituição. Confirme o endereço de entrega.
  • Filial 2: Se o cliente recusar:
    • Aconselhar o monitoramento da conta em busca de transações não autorizadas.

Etapa 4: Configurar alertas de transação

Escolha o método de alerta: SMS, e-mail ou ambos?

  • Filial 1: Se um cliente escolher:
    • Defina alertas para transações acima de um valor especificado. Peça o valor.
  • Filial 2: Se não tiver certeza:
    • Sugira um valor padrão (por exemplo, US$ 50) e confirme.

Etapa 5: Forneça um resumo e as próximas etapas

  • Investigando a transação não reconhecida.
  • Congelar o cartão de débito e possivelmente emitir um substituto.
  • Configurando alertas de transação conforme solicitado.

Justificativa:

Esse processo aborda com eficiência diversas dúvidas dos clientes por meio de etapas e ramificações de decisão claras, garantindo soluções abrangentes.

Limitações do prompt CoT

Limitações do prompt de berço

A cadeia de pensamento é realmente eficaz, mas também está sujeita ao caso de uso em que é aplicada e a vários outros fatores. Existem desafios específicos associados a Solicitação de CoT na IA que impedem que os stakeholders aproveitem completamente seu potencial. Vamos dar uma olhada nos gargalos comuns:

Complicar Tarefas Simples

Embora o prompt CoT funcione melhor para tarefas complexas, ele pode complicar tarefas simples e gerar respostas erradas. Para tarefas que não exigem raciocínio, modelos de resposta direta funcionam melhor.

Aumento da carga computacional

O processamento de prompts de CoT requer carga computacional significativa e se a técnica for implantada em modelos menores que são construídos com capacidades de processamento limitadas, ela pode sobrecarregá-los. As consequências de tais implantações podem incluir tempos de resposta mais lentos, baixa eficiência, incoerência e muito mais.

Qualidade da Engenharia de Prompt de IA

Solicitação de CoT em IA funciona sob a suposição (ou princípio) de que um prompt específico é bem articulado, estruturado e claro. Se um prompt não tiver esses fatores, o prompt CoT perde a capacidade de compreender o requisito, resultando na geração de etapas sequenciais irrelevantes e, finalmente, respostas.

[Leia também: O que são modelos de linguagem pequena? Exemplos do mundo real e dados de treinamento]

Capacidades reduzidas em escala

Os stakeholders podem ter dificuldades com seus modelos se tiverem que alavancar o prompt de cadeia de pensamento para volumes massivos de conjuntos de dados ou complexidades de problemas. Para tarefas que envolvem etapas maiores de raciocínio, a técnica pode diminuir o tempo de resposta, tornando-a inadequada para aplicativos ou casos de uso que exigem geração de resposta em tempo real.

O prompt CoT é uma técnica fenomenal para otimizar o desempenho de Modelos de linguagem grandes. Se tais deficiências puderem ser abordadas e resolvidas por meio de técnicas de otimização ou soluções alternativas, elas podem gerar resultados incríveis. Conforme a tecnologia avança, será interessante ver como o prompting da Cadeia de Pensamento evolui e se torna mais simples, mas também mais específico.

Gostou deste artigo? Siga Shaip no LinkedIn para mais atualizações.

Ações Sociais