Brasil,

O que é OCR e por que é tão essencial para nossa vida pessoal e profissional?

  • Crédito de Imagens:Divulgação - Escrito ou enviado por  Mariana Seman
  • SEGS.com.br - Categoria: Seguros
  • Imprimir

O reconhecimento óptico de caracteres (OCR) é uma tecnologia de ponta que serve de base para dezenas de ferramentas que usamos todos os dias. Simplificando, é um tipo de software que "traduz" documentos digitalizados em um formato que o computador pode ler.

Sem o OCR, o computador percebe cada documento digitalizado como uma única imagem, da mesma forma que vemos fotografias ou obras de arte. Nesse formato, o computador não reconhece letras, palavras ou frases individuais. Isso limita as maneiras como o computador e, portanto, o usuário, podem interagir com os mais diversos documentos.

O software de digitalização OCR permite que o computador "veja" um documento digitalizado da mesma forma que vemos documentos baseados em textos criados no Word, Excel ou programas equivalentes. Isso permite trabalhar com documentos digitalizados da mesma forma que faria com documentos originais, o que inclui:

Usar funções de pesquisa;
Editar;
Usar ferramentas de comparação e análise;
Processamento, armazenamento, recuperação e compartilhamento de informações.

O reconhecimento óptico de caracteres pode ser usado para traduzir um texto impresso e inclui dois processos projetados para capturar dados manuscritos:

Reconhecimento inteligente de caracteres (ICR): o processo de captura e tradução de caracteres impressos à mão e escritos, como em formulários estruturados;
Reconhecimento óptico de marca (OMR): o processo de captura de dados marcados por humanos em formulários de documentos, como pesquisas de múltipla escolha, questionários e testes na forma de linhas ou áreas sombreadas.

Juntas, essas soluções de software de reconhecimento são úteis em uma ampla variedade de aplicações e situações.

Como o OCR funciona

Aprimoramento

Para ajudar o software OCR a traduzir com sucesso um documento, tecnologias de aprimoramento de imagem, como a Perfect Page, da Kodak Alaris, “limpam” e automaticamente procuram e corrigem erros ou problemas comuns de digitalização de documentos, realizando:

Ajuste de digitalizações distorcidas ou tortas;
Remoção de manchas, linhas e outras imperfeições de impressão da "visão" do computador;
Compensação de manchas e outras imperfeições não impressas na página;
Análise de layout de colunas, imagens, tabelas e outros recursos.

Esse tipo de tecnologia já vem integrada ao portfólio de scanners da marca para otimizar a clareza dos dados e maximizar a precisão do OCR, criando os menores tamanhos de arquivo possíveis.

Classificação

Depois que os dados são convertidos e aprimorados, a próxima etapa no processo de OCR é entender qual tipo de documento entrou no sistema e determinar a próxima etapa para esse tipo de documento.

OCR, ICR e OMR permitem software de captura como Kodak Capture Pro e Kodak Info Input Solution para determinar que tipo de documento foi inserido. Em seguida, o software pode obter as imagens e aplicar regras de classificação com base no conteúdo do documento, layout do documento, códigos de barras ou dados de indexação.

A classificação determinará se um documento é, por exemplo, uma fatura, prontuário de paciente, arquivo de empréstimo ou registro de imposto. E o Info Input Solution pode fazer captura avançada de documentos com apenas uma ou duas amostras para aprender a classificar os documentos.

A Kodak Alaris faz isso por meio de algoritmos de aprendizado de máquina patenteados. O sistema usa diversas técnicas para classificar os dados: pesquisa de conteúdo, imagens, códigos de barras e fusão de um documento. Se o sistema tiver pouca confiança em qualquer documento que tenta classificar, o processo pode chamar um operador humano para confirmação, assim como somos chamados para verificar textos antigos que os computadores não conseguem decifrar usando Captcha.

Extração de Dados

A última etapa do processo de OCR é a extração de dados.

Extrair as informações mais importantes de um documento para usar como metadados ou dados de índice é vital para recuperação e processamento. A classificação automatizada com base em regras informa o sistema sobre quais informações-chave devem existir em um documento e, frequentemente, onde essas informações devem ser colocadas.

As soluções de software da Kodak Alaris podem identificar o texto no seu documento usando o reconhecimento de padrões e recursos. Eles identificam o idioma do documento que está sendo digitalizado e classificam o texto em letras, palavras, frases e parágrafos individuais.

Em seguida, o software extrai e cria uma cópia dessas informações para usar como metadados na próxima fase do processo. No caso de documentos, os metadados podem ser usados para organizar, localizar e/ou alimentar documentos em outro tipo de sistema de negócios.

Com essas soluções, você pode extrair os dados com base nas regras de negócios e nas informações de que uma empresa precisa por meio de pesquisas no banco de dados. Os usuários podem configurar o processo de indexação para extrair automaticamente os dados principais dos documentos (via código de barras, OCR, ICR ou OMR), reduzindo o tempo de processamento.

Por que o OCR é importante

A tecnologia OCR oferece muitos benefícios nas esferas pessoal e profissional. O software de reconhecimento óptico de caracteres torna possível traduzir texto impresso de quase qualquer material e, quer você perceba quer não, você usa muitas dessas funcionalidades todos os dias. Você também se beneficia da aplicação de outras pessoas e organizações. Por exemplo, o uso da tecnologia OCR pela polícia para identificar placas de veículos os ajuda a nos manter seguros. O uso de reconhecimento de assinatura digital pelos bancos, uma forma de OCR, evita que possíveis ladrões de identidade acessem e gastem seu dinheiro.

OCR no local de trabalho

O OCR pode ser particularmente benéfico no local de trabalho. Por exemplo, as empresas podem digitalizar documentos existentes por meio de software OCR e transformá-los instantaneamente em formatos compatíveis com programas de texto para voz. Isso pode ajudar as empresas, por exemplo, para que possam atender às necessidades dos clientes com deficiência visual em tempo real.

Em outros setores, como na assistência médica, a tecnologia OCR pode literalmente salvar vidas. O software de digitalização para OCR pode fazer com que a enorme quantidade de informações no histórico médico de um paciente possa ser salva, pesquisável e verificável, melhorando a acessibilidade e evitando erros perigosos.

Sobre a divisão Alaris da Kodak Alaris

A Kodak Alaris é uma provedora líder do setor de soluções de captura de informações que simplificam os processos de negócios. A empresa trabalha para ajudar o mundo a entender as informações com soluções conectadas e inteligentes, habilitadas por décadas de inovação na ciência da imagem. As premiadas linhas de scanners, software e serviços estão disponíveis em todo o mundo e através de uma rede de parceiros de canal. Para obter mais informações, acesse www.alarisworld.com/pt-br e siga @AlarisLATAM.


Compartilhe:: Participe do GRUPO SEGS - PORTAL NACIONAL no FACEBOOK...:
 
https://www.facebook.com/groups/portalnacional/

<::::::::::::::::::::>
IMPORTANTE.: Voce pode replicar este artigo. desde que respeite a Autoria integralmente e a Fonte...  www.segs.com.br
<::::::::::::::::::::>
No Segs, sempre todos tem seu direito de resposta, basta nos contatar e sera atendido. -  Importante sobre Autoria ou Fonte..: - O Segs atua como intermediario na divulgacao de resumos de noticias (Clipping), atraves de materias, artigos, entrevistas e opinioes. - O conteudo aqui divulgado de forma gratuita, decorrem de informacoes advindas das fontes mencionadas, jamais cabera a responsabilidade pelo seu conteudo ao Segs, tudo que e divulgado e de exclusiva responsabilidade do autor e ou da fonte redatora. - "Acredito que a palavra existe para ser usada em favor do bem. E a inteligencia para nos permitir interpretar os fatos, sem paixao". (Autoria de Lucio Araujo da Cunha) - O Segs, jamais assumira responsabilidade pelo teor, exatidao ou veracidade do conteudo do material divulgado. pois trata-se de uma opiniao exclusiva do autor ou fonte mencionada. - Em caso de controversia, as partes elegem o Foro da Comarca de Santos-SP-Brasil, local oficial da empresa proprietaria do Segs e desde ja renunciam expressamente qualquer outro Foro, por mais privilegiado que seja. O Segs trata-se de uma Ferramenta automatizada e controlada por IP. - "Leia e use esta ferramenta, somente se concordar com todos os TERMOS E CONDICOES DE USO".
<::::::::::::::::::::>

voltar ao topo

Adicionar comentário

Aja com responsabilidade aos SEUS COMENTÁRIOS, em Caso de Reclamação, nos reservamos o Direito, a qualquer momento de Mudar, Modificar, Adicionar, ou mesmo Suprimir os comentarios de qualquer um, a qualquer hora, sem aviso ou comunicado previo, leia todos os termos... CLIQUE AQUI E CONHEÇA TODOS OS TERMOS E CONDIÇÕES DE USO. - O Nosso muito obrigado - Ferramenta Automatizada...IMPORTANTE: COMENTÁRIOS com LINK são bloqueados automaticamente (COMMENTS with LINKS are automatically blocked.)...Sucesso!

Security code Atualizar

Enviar