Resumo rápido: OCR não é só “ler o número”. Para fechar com confiança, você precisa de validação por regras e uma fila de revisão para os casos atípicos.
Por que o OCR falha em hidrômetros (e isso é normal)
Hidrômetros e medidores de gás trazem desafios típicos: reflexo no visor, ângulo ruim, vidro sujo, iluminação desigual, dedos cobrindo parte do medidor, compressão do WhatsApp e até variações de modelo. Quando o OCR falha, raramente é “problema da IA” — normalmente é uma combinação de captura e contexto.
Os 7 vilões mais comuns
- Reflexo no visor e áreas estouradas (branco “chapado”).
- Baixa resolução e compressão (principalmente em envio por mensageria).
- Desfoque por movimento, foco errado ou trepidação.
- Ângulo que distorce o visor e “corta” dígitos.
- Sujeira, umidade, vidro riscado ou embaçado.
- Ocultação (mão, tubo, lacre, sombra forte).
- Modelos diferentes com layout de dígitos e cores variando.
Captura: a qualidade da foto decide metade do resultado
Antes de falar de IA, vale padronizar a captura. Duas ou três regras simples de campo normalmente aumentam muito a taxa de acerto.
Checklist de captura (prático)
- Encostar o celular a uma distância constante (nem muito perto, nem muito longe).
- Evitar reflexo: mudar ângulo 10–20 graus quando necessário.
- Garantir foco no visor (toque para focar no visor).
- Sem flash direto no vidro se estiver refletindo.
- Uma foto do medidor “inteiro” + uma foto do visor (quando possível).
Tratamento de imagem: o “pré-processamento” que salva o mundo real
O OCR melhora quando você “entrega” para a IA uma imagem mais legível. Em um fluxo profissional, isso é automático no backend.
O que normalmente é feito no backend
- Recorte do visor (detecção automática ou guiada).
- Correção de perspectiva (endireitar o visor).
- Equalização/contraste para realçar dígitos.
- Redução de ruído e nitidez controlada.
- Geração de versões (colorida + alto contraste) para aumentar robustez.
Validação: o que transforma OCR em leitura confiável
Mesmo com uma boa IA, sempre existirão leituras “possíveis” mas erradas. A solução é aplicar regras de consistência antes de aceitar o valor.
Exemplos de validações úteis
- Não-regressão: leitura atual não pode ser menor que a anterior (salvo exceções bem definidas).
- Limite de variação: consumo fora de padrão vai para revisão.
- Formato do medidor: dígitos inteiros e decimais no padrão esperado.
- Confiança da IA: se abaixo do threshold, enviar para fila.
Dica: validação não “briga” com a IA. Ela funciona como um cinto de segurança: impede que um caso ambíguo vire cobrança incorreta.
Revisão por exceção: a forma certa de escalar
O objetivo não é ter 100% automático — é ter 100% de controle com o mínimo de esforço humano. Quando o sistema separa “OK” de “suspeito”, seu time revisa só o necessário.
O que vai para revisão
- Imagem ruim/ocultada/reflexo forte
- Consumo muito fora do padrão
- Leitura “quase certa” (confiança intermediária)
- Inconsistência entre versões de imagem (colorida vs contraste)
Fluxo recomendado (ponta a ponta)
- Captura no app (com checklist simples)
- Tratamento automático + recorte do visor
- OCR/IA (uma ou mais tentativas / versões)
- Validação por regras e thresholds
- Fila de exceções para revisão humana
- Fechamento com relatórios e exportações
Erros comuns em projetos de OCR (para evitar)
- Testar só com imagens “boas” e assumir taxa de acerto igual no campo.
- Não versionar imagens (não ter evidência por unidade/competência).
- Não validar leituras (confiar em um único resultado).
- Não ter fila de exceção (a equipe vira “revisora de tudo”).
Perguntas frequentes
Qual taxa de acerto é “boa” para OCR em hidrômetros?
Depende do cenário. O ponto não é só acerto bruto — é acerto com controle. Um fluxo com validação + revisão por exceção mantém confiabilidade mesmo quando a foto é ruim.
Preciso treinar modelo específico para cada medidor?
Nem sempre. Boas práticas de captura + pré-processamento + regras já resolvem muita coisa. Se houver grande diversidade de modelos, dá para ajustar o pipeline por tipo.
Como reduzir retrabalho do time?
Direcionando o time para a fila de exceções e garantindo que o sistema explique “por que” aquela leitura precisa de revisão (ex.: confiança baixa, variação alta, inconsistência).
Quer ver esse fluxo aplicado no seu cenário?
A gente monta um processo recomendado com base em número de unidades, frequência de leitura e padrões de consumo.