Aprender / OCR

Dicas de Precisão de OCR em PDF

Recebendo texto embaralhado do OCR? Estas dicas práticas vão ajudar você a obter resultados quase perfeitos mesmo de documentos digitalizados difíceis.

Pronto para executar o OCR? Use a ferramenta de scanner gratuita.

Executar OCR

O Que Afeta a Precisão do OCR?

A precisão do OCR é determinada principalmente pela qualidade da imagem que entra. Mesmo o melhor motor de OCR não consegue ler de forma confiável um texto borrado, torto ou com baixo contraste. Veja o que mais importa:

  • Resolução (DPI) — o fator isolado mais importante
  • Alinhamento da página — reta vs. inclinada/torta
  • Contraste — texto escuro sobre fundo claro vs. desbotado ou com sombra
  • Tipo de fonte — fontes impressas padrão vs. manuscrito ou fontes decorativas
  • Configuração de idioma — correspondendo ao idioma do documento

7 Dicas para Melhorar a Precisão do OCR

1

Digitalize em pelo menos 300 DPI

A maioria dos aplicativos de scanner usa por padrão 150 ou 200 DPI — altere isso antes de digitalizar. Para documentos com fontes pequenas (notas de rodapé legais, letras miúdas), use 400 DPI. Passar de 600 DPI aumenta o tamanho do arquivo sem melhorar a precisão.

2

Mantenha as páginas planas e retas

Uma inclinação de 5 graus reduz a precisão do OCR de forma perceptível. Use um scanner de mesa em vez da câmera do celular sempre que possível. Se você está trabalhando com uma digitalização torta já existente, use a ferramenta Girar PDF para corrigir o ângulo antes de executar o OCR.

3

Garanta um bom contraste

Texto escuro sobre fundo branco é o ideal. Documentos desbotados, papel colorido ou marcas claras de lápis reduzem a precisão. Se for digitalizar novamente, aumente a configuração de contraste do scanner.

4

Limpe primeiro as fotos de celular

As câmeras de celular introduzem sombras, distorção de perspectiva e reflexos que prejudicam o OCR. Passe sua foto pela Limpeza de Digitalização do PDF.it antes do OCR — ela remove sombras, corrige a perspectiva e aumenta o contraste automaticamente.

5

Selecione o idioma correto

Os motores de OCR usam modelos de idioma para resolver caracteres ambíguos. Selecionar o idioma certo (especialmente para documentos que não estão em inglês) pode melhorar a precisão em 5–15%. Isso importa mais para caracteres acentuados em português, espanhol, francês e alemão.

6

Divida PDFs grandes para processamento mais rápido

PDFs digitalizados muito grandes (100+ páginas) podem expirar o tempo limite. Divida primeiro o PDF em seções menores usando a ferramenta Dividir PDF, execute o OCR em cada seção e depois junte os resultados novamente.

7

Tente escala de cinza em vez de cor para documentos de texto

Para documentos de texto em preto e branco, as digitalizações em escala de cinza são menores e processam mais rápido sem sacrificar a precisão. Use digitalização colorida apenas se o documento tiver texto colorido ou gráficos coloridos importantes.

Precisão do OCR por Tipo de Documento

Tipo de DocumentoPrecisão TípicaMelhor Prática
Texto impresso, 300+ DPI98–99%Pronto para usar
Foto de celular, boa iluminação90–95%Execute a Limpeza de Digitalização primeiro
Documento datilografado antigo/desbotado80–90%Aumente o contraste antes de digitalizar
Manuscrito em letra de forma organizada70–85%Revisão manual recomendada
Manuscrito em letra cursiva40–60%Transcrição manual pode ser necessária

Execute OCR no Seu PDF Digitalizado

Scanner OCR gratuito — 10 conversões/dia, sem necessidade de software.

Executar OCR Agora

Perguntas Frequentes

Em que DPI devo digitalizar para melhor precisão de OCR?

300 DPI é o mínimo recomendado para OCR. 400–600 DPI é melhor para documentos com fontes pequenas. Acima de 600 DPI aumenta o tamanho do arquivo sem melhorar a precisão de forma significativa.

Por que o OCR confunde caracteres como 0 e O?

Esses caracteres parecem visualmente semelhantes, especialmente em baixa resolução. Os motores de OCR usam o contexto do idioma para adivinhar o caractere correto — selecionar o idioma certo nas configurações de OCR ajuda significativamente.

A digitalização colorida melhora a precisão do OCR?

Para texto padrão em preto e branco, a digitalização em escala de cinza geralmente é suficiente. A digitalização colorida é útil para texto colorido ou fundos coloridos que desapareceriam em escala de cinza.

Como melhorar o OCR de uma foto de documento tirada com o celular?

Use a ferramenta de Limpeza de Digitalização do PDF.it antes de executar o OCR. Ela remove sombras, corrige a perspectiva e melhora o contraste — tudo isso melhora significativamente a precisão do OCR.

O OCR consegue reconhecer texto manuscrito?

O OCR padrão é otimizado para texto impresso. Funciona para escrita organizada em letra de forma, mas tem dificuldade com letra cursiva ou informal.