Reconhecimento de Textos com OCR e Python

Name: Reconhecimento de Textos com OCR e Python
Rating: 4.7 (413 reviews)

OpenCV, Tesseract, EasyOCR e EAST aplicado em imagens e vídeos! Crie seu próprio OCR do zero com Deep Learning!

Highest Rated

Created byJones Granatyr, Gabriel Alves, IA Expert Academy

Last updated 1/2025

Portuguese

What you'll learn

Utilizar as ferramentas Tesseract, EAST e EasyOCR para reconhecimento de caracteres
Entender as diferenças entre o OCR em ambientes controlados e ambientes naturais
Aplicar técnicas de pré-processamento de imagens para melhorar a qualidade das imagens, tais como: limiarização, inversão, redimensionamento, operações morfológicas e redução de ruído
Utilizar a estrutura EAST aplicado em reconhecimento em cenários naturais
Treinar um OCR do zero utilizando Deep Learning e Redes Neurais Convolucionais
Reconhecer textos em imagens e vídeos
Buscar termos específicos em imagens de um diretório
Preparar imagens escaneadas para o reconhecimento de textos
Tratar imagens de carros para a identificação de placas

Course content

13 sections • 102 lectures • 13h 58m total length

Boas-vindas e conteúdo do curso11:01
Mais sobre Visão Computacional0:12
Introdução à OCR10:43
Recursos para download0:07

Introdução ao Tesseract16:01
Preparação do ambiente7:23
Primeiro reconhecimento de texto1:56
Suporte para outros idiomas13:19
Resolvendo problema relacionado ao pacote de idiomas1:07
Modo de segmentação de página (PSM)8:57
Detecção de orientação da página4:32
Seleção dos textos 113:57
Seleção dos textos 27:12
Seleção dos textos 39:05
Busca com expressões regulares9:04
Detecção em cenários naturais6:45

Escala de cinza9:06
Limiarização - teoria10:15
Limiarização simples5:52
Limiarização com Método de Otsu5:50
Limiarização adaptativa8:13
Limiarização adaptativa gaussiana4:59
Inversão de cores4:03
Redimensionamento - teoria7:14
Redimensionamento - implementação3:57
Operações morfológicas - teoria5:19
Operações morfológicas - implementação10:27
Remoção de ruído - teoria13:20
Remoção de ruído - implementação8:39
Reconhecimento de textos4:23
EXERCÍCIO0:10
Solução o exercício4:20

Importação das bibliotecas5:27
Base de dados MNIST 0-910:39
Base de dados Kaggle A-Z10:42
Junção das bases de dados6:09
Pré-processamento dos dados19:37
Construção da rede neural12:01
Treinamento da rede neural9:43
Avaliação da rede neural10:47
Salvar a rede neural2:44
Testes com imagens12:08
Preparação do ambiente6:14
Pré-processamento da imagem8:37
Detecção de contornos15:12
Processamento das detecções 113:03
Processamento das detecções 28:19
Reconhecimento dos caracteres14:12
Problema do 0 e O, 1 e l, 5 e S9:17
Problema do texto não detectado11:30

Requirements

Lógica de programação, principalmente estruturas condicionais e de repetição
Programação básica em Python

Description

Dentro da área da Visão Computacional existe a sub-área de Reconhecimento Ótico de Caracteres (ou OCR - Optical Character Recognition) que basicamente visa transformar imagens em textos. Em outras palavras, o OCR pode ser descrito como a conversão de imagens contendo texto digitado, escrito a mão ou impresso, em caracteres que uma máquina é capaz de entender. A imagem em questão pode ser um documento escaneado ou fotografado, na qual o texto é o principal objeto de interesse. Outro exemplo são imagens menos direcionadas, como uma fotografia de um cenário onde aparecem placas e fachadas.

Por meio do OCR, é possível converter documentos escaneados ou fotografados em textos que podem ser editados em qualquer ferramenta, como o Microsoft Word por exemplo. Outro exemplo de aplicação são os leitores automáticos de formulários, nos quais você pode enviar uma foto da sua CNH (carteira nacional de habilitação), RG (registro geral) ou cartão de crédito e o sistema consegue fazer a leitura de todos os seus dados. Um carro autônomo pode utilizar OCR para ler as placas de trânsito e um condomínio pode ler a placa do carro, verificar se consta na base de dados para então liberar o acesso ao pátio! Existe uma infinidade de aplicações que podem ser desenvolvidas!

E para levar você até essa área, neste curso você aprenderá na prática como utilizar várias bibliotecas de OCR para reconhecer textos em imagens e vídeos, tudo passo a passo e utilizando a linguagem Python! Vamos utilizar o Google Colab, ou seja, você não precisa se preocupar com instalações e configurações de bibliotecas em sua máquina, pois tudo será desenvolvido on-line utilizando as GPUs do Google! Além de utilizar ferramentas prontas, você também aprenderá como construir o seu próprio OCR do zero utilizando Deep Learning e Redes Neurais Convolucionais! Confira abaixo os principais tópicos que você aprenderá:

Reconhecimento de textos em imagens e vídeos com Tesseract, EasyOCR e EAST
Busca em imagens utilizando expressões regulares
Técnicas para melhoria da qualidade das imagens, bem como: limiarização, inversão, escala de cinza, redimensionamento, remoção de ruídos e operações morfológicas
Uso da arquitetura EAST e da biblioteca EasyOCR para melhor desempenho em cenários naturais
Treinamento de um OCR do zero utilizando TensorFlow e modernas técnicas de Deep Learning com Redes Neurais Convolucionais
Busca por ocorrências de textos em imagens
Aplicação de técnicas de processamento de linguagem natural nos textos extraídos pelo OCR (nuvem de palavras e extração de entidades nomeadas)
Como preparar imagens vindas de fotos e scanners
Pré-processamento de imagens para extração e reconhecimento de placas de carros

Esses são somente alguns dos tópicos principais, e ao final do curso, você saberá tudo o que precisa para criar seus próprios projetos de reconhecimento de textos utilizando OCR!

Who this course is for:

Pessoas interessadas em OCR (Optical Character Recognition - Reconhecimento Ótico de Caracteres)
Alunos de graduação e pós-graduação que cursam disciplinas de Computação Gráfica, Processamento Digital de Imagens ou Inteligência Artificial
Cientistas de Dados que queiram aumentar seus conhecimentos em Visão Computacional
Profissionais interessados em desenvolver soluções profissionais de reconhecimento ótico de caracteres
Pessoas interessadas em criar o seu próprio OCR personalizado

Reconhecimento de Textos com OCR e Python

What you'll learn

Explore related topics

Course content

Introdução4 lectures • 22min

OCR com Tesseract12 lectures • 1hr 39min

Técnicas para pré-processamento de imagens16 lectures • 1hr 46min

OCR com EAST para cenários naturais6 lectures • 1hr 12min

Treinamento de OCR personalizado18 lectures • 3hr 6min

Cenários naturais com EasyOCR6 lectures • 43min

OCR em vídeos5 lectures • 43min

Projeto 1: Busca por termos específicos8 lectures • 52min

Projeto 2: Scanner de documento + OCR6 lectures • 40min

Projeto 3: Leitura de placas de carros4 lectures • 18min

Requirements

Description

Who this course is for: