Como analisar respostas abertas (verbatim) com IA
As respostas abertas são onde a pesquisa deixa de contar quantos e passa a explicar por quê. É ali, nas palavras do próprio respondente, que aparece a razão de uma nota baixa, o motivo de um abandono, o elogio inesperado. O problema é conhecido: ler centenas ou milhares de verbatim à mão é lento, cansativo e difícil de manter consistente. É exatamente esse gargalo que a IA vem resolver — sem substituir o julgamento humano.
O que é codificação (ou categorização) de verbatim
Verbatim é o texto literal que o respondente escreveu numa pergunta aberta — do tipo "Por que você deu essa nota?" ou "O que poderíamos melhorar?". Sozinhas, essas respostas são difíceis de somar: cada pessoa escreve de um jeito. Codificar (ou categorizar) é o processo de agrupar essas respostas em temas — atendimento, preço, entrega, qualidade do produto — para que você possa contar quantos falaram de cada assunto e, assim, transformar texto em números.
Feita a categorização, a análise de abertas responde a três perguntas práticas: sobre o que as pessoas falam (os temas), com que frequência cada tema aparece (a contagem) e com que tom falam de cada um (o sentimento — positivo, neutro ou negativo). Junto com os cruzamentos do quantitativo, é o que dá profundidade a qualquer relatório.
O método tradicional: o codebook manual
A abordagem clássica é construir um codebook (livro de códigos). Um analista lê uma amostra das respostas, define uma lista de categorias e depois passa por cada verbatim atribuindo um ou mais códigos. É um método sólido e testado — a leitura humana capta contexto, gíria e subentendido que nenhuma máquina lê perfeitamente. Mas tem limites reais quando o volume cresce:
- É lento. Milhares de respostas podem levar dias de trabalho dedicado.
- É inconsistente. Dois codificadores diferentes — ou a mesma pessoa cansada no fim do dia — classificam o mesmo texto de formas distintas.
- Não escala. Em estudos de tracking, com ondas recorrentes, refazer a codificação a cada rodada consome horas que poderiam ir para a interpretação.
Fazer isso no Excel, marcando categoria por categoria à mão, funciona para dezenas de casos. Para centenas ou milhares, vira um funil que atrasa o relatório inteiro.
Como a IA acelera a análise
Modelos de linguagem são bons justamente na tarefa que trava o processo manual: ler muito texto rápido e agrupar por semelhança de significado. Na prática, a IA ajuda em três frentes:
- Sugere os temas. Em vez de você inventar o codebook do zero, a IA lê o conjunto de respostas e propõe as categorias que emergem — "preço alto", "demora na entrega", "atendimento cordial" — que você depois ajusta.
- Classifica cada resposta. Uma vez definidas as categorias, a IA atribui os temas a cada verbatim de forma consistente, aplicando o mesmo critério do primeiro ao último caso.
- Marca o sentimento e conta. Cada resposta recebe um tom (positivo, neutro, negativo) e o resultado vira uma tabela: quantos por cento falaram de cada tema e como se dividem por sentimento.
Um alerta honesto: automatizar não é o mesmo que terceirizar a responsabilidade. A IA erra — pode inventar uma categoria genérica demais, confundir uma crítica com um elogio ou tropeçar em ironia. Por isso o bom fluxo é sempre IA com revisão humana: a máquina faz o trabalho pesado de ler e organizar; a pessoa valida, corrige e decide o que a categoria significa para o negócio. Vale a mesma lógica que discutimos no texto sobre IA na pesquisa de mercado — a IA acelera, o especialista continua no comando.
Boas práticas para não errar
- Revise as categorias antes de contar. Um codebook com temas sobrepostos ou vagos demais ("outros", "diversos") polui a contagem. Consolide o que é a mesma coisa e separe o que precisa ser distinguido — isso vale tanto para IA quanto para o método manual.
- Cuidado com viés na definição dos temas. Se o codebook for construído só a partir do que você espera ouvir, temas inesperados — e às vezes os mais importantes — se perdem no "outros". Deixe espaço para o que você não previu.
- Trate nuance, ironia e negação com atenção. "Adorei esperar 40 minutos na fila" é uma crítica, não um elogio. Sarcasmo, dupla negação e comparações são onde a classificação automática mais escorrega — reserve uma passada de revisão para os casos ambíguos e para o sentimento.
- Permita múltiplos temas por resposta. Uma frase pode falar de preço e atendimento ao mesmo tempo. Forçar uma categoria única distorce a leitura.
- Cheque as bases pequenas. "60% citaram X" em cima de dez respostas não é conclusão, é ruído — o mesmo cuidado que se tem na análise de pesquisa de mercado em geral.
Um exemplo de saída
Depois de categorizada, uma pergunta aberta do tipo "O que podemos melhorar?" passa a ser lida como uma tabela. Os números abaixo são fictícios, apenas para ilustrar o formato:
| Tema | Menções | Sentimento predominante |
|---|---|---|
| Tempo de entrega | 32% | Negativo |
| Preço | 24% | Negativo |
| Atendimento | 18% | Positivo |
| Qualidade do produto | 15% | Positivo |
| Outros | 11% | Neutro |
De uma pilha de texto solto, você sai com prioridades claras: o tempo de entrega é a dor mais citada e majoritariamente negativa, enquanto o atendimento é um ponto forte a proteger. Esse tipo de leitura combina bem com métricas de acompanhamento como o NPS — se quiser calcular o seu, use a calculadora de NPS e cruze a nota com os temas das justificativas.
Como fazer no AnaliseTAP
No AnaliseTAP, a análise de abertas faz parte do mesmo fluxo da tabulação. Depois de importar seu arquivo de Excel ou SPSS, a plataforma detecta quais perguntas são abertas e aplica a categorização automática com IA: ela agrupa as respostas em temas, marca o sentimento de cada uma e devolve as contagens por categoria. O ponto central é que o codebook fica editável — você renomeia temas, funde categorias parecidas, separa o que ficou junto e recategoriza, mantendo o controle humano sobre o resultado.
Como tudo acontece no mesmo lugar, os temas das abertas podem ser cruzados com o perfil dos respondentes e acompanhados ao longo das ondas de um tracking, sem refazer a codificação do zero a cada rodada. O trabalho braçal sai da frente; o que sobra é interpretar.
Analise suas abertas junto com o resto da pesquisa
O AnaliseTAP importa Excel/SPSS e gera tabulação cruzada, significância com letras A/B/C, categorização de abertas com IA (temas + sentimento), ponderação amostral, banner tables e relatórios executivos — automaticamente, num único fluxo.
Analisar minha pesquisa