Quem já não precisou editar aquele arquivo pdf que você pegou na internet para fazer alguns ajustes e recriá-lo como se fosse seu?
Com certeza muitos já precisaram. Se é de boa fé ou não, não tenho como afirmar mas ferramenta para isso existe.
Antes de apresentar a ferramenta específica é necessário que se fale um pouco sobre como isso funciona. O OCR é um acrônomio da palavra inglesa Optical Character Recognition que em português seria algo como Reconhecimento óptico de caracter. O sistema consiste em reconhecer letras em um mapa de bits. Mapas de bits são os arquivos de imagem e o PDF se enquadra nessa categoria.
O ABBY é a ferrmenta que faz esse serviço de orc e automaticamente joga esses caracteres reconhecidos num arquivo de word. O diferencial é que ele é um aplicativo altamente configurável podendo o usuário definir por exemplo o que é texto, o que é imagem e o que é tabela dentro do PDF para que ele seja exportado de maneira fiel para o Word.
Aqui no trabalho ele é muito útil e posso dizer que ele é muito prático e intuitivo. Para quem não quer ter trabalho ele ainda possui um wizard que faz todo esse reconhecimento automaticamente.
Como o OCR ainda não chegou na sua plenitude de perfeição, obviamente há algumas letras que ele acaba deixando escapar, muito mais pela péssima resolução da imagem do que propriamente falaha do programa, mas para isso ele efetua um corretor ortográfico após essa conversão.
É claro que é um programa pago mas ele possui um trial de 30 dias. Vistem e aprovem!
Comentários desativados
Coment?rios est?o bloqueados