Melhorar Imagem para leitura do OCR

Bom gente estou com uma duvida numa imagem, depois de passar o filtro e tal, precisava endireita as letras e tal

como posso fazer isso?

http://img571.imageshack.us/img571/7094/entradai.jpg

Essas imagens são intencionalmente feitas para serem difíceis de serem processadas por um computador.

O que motivou a sua criação é justamente impedir que bots automáticos usem sites como se fossem serem humanos.
Como nossa capacidade de processamento de imagem visual é muitíssimo superior do que a do computador, o que nossa visão faz de maneira trivial, é super difícil de se colocar em um algorítmo.

Se quiser processar captchas, pode iniciar um curso de mestrado em processamento de imagens.

Eu começaria limpando o fundo, que não está ajudando em nada o captcha a ser mais difícil. Em seguida, talvez tentaria alguma operação de abertura morfológica, para limpar as linhas.
O difícil seria eliminar a distorção das letras. Talvez o mais fácil seria treinar uma base de letras distorcidas em algum OCR.

[quote=ViniGodoy]Eu começaria limpando o fundo, que não está ajudando em nada o captcha a ser mais difícil. Em seguida, talvez tentaria alguma operação de abertura morfológica, para limpar as linhas.
O difícil seria eliminar a distorção das letras. Talvez o mais fácil seria treinar uma base de letras distorcidas em algum OCR.[/quote]

entao talvez meu TCC vai ser sobre processamento de imagens

mais enfim

eu limpei o fundo já e tal, so falta as linhas e endireita as letras
pensei em usar função cos e sen para ver se endireita um pouco as letras, agora tirar as linhas num tenho ideia de como da pra fazer

Você até pode tentar. Mas o seguinte: Você está enxergando a imagem, por isso sabe que talvez essa operação funcione, e quais os valores aproximados para usar na operação.
Ou seja, você teve essa ideia porque seu cérebro já reconheceu as letras.

Agora imagine a tarefa real, que um bot teria que fazer.
Você não estaria lá para ver a imagem antes, então, como o programa descobriria que as letras estão tortas e para que lado?

O que uma pesquisa simples no Google me retornou …

“neural network captcha solving”

http://www.wausita.com/captcha/
http://news.softpedia.com/news/JavaScript-based-Neural-Net-Solves-CAPTCHA-102884.shtml

E viu só? Estamos mesmo falando em teses e pesquisa científica. :slight_smile:

então, fica mais dificil do que pensei sobre o OCR reconhecer…rsrs

Você pode restringir seu captcha solver para decodificar, por exemplo, os captchas da Receita Federal :slight_smile: - se não me engano, são bastante simples de propósito.

aah sim, já peguei muitos captcha simples e tal, so que esse tá bem mais complicado…rsrs

Essa ideia não é nova: http://www.thiagovespa.com.br/blog/2010/09/26/quebrando-captchas/

Essa ideia não é nova: http://www.thiagovespa.com.br/blog/2010/09/26/quebrando-captchas/[/quote]

Eu li já esse site…mas ele mostra o que deve ser feito só né

Ué, e precisa mostrar mais alguma coisa?

Ué, e precisa mostrar mais alguma coisa?[/quote]

eu já tinha imaginado como fazer o que ele faço

meu problema é como interpreta isso em java…essa é a duvida

Por que é que tem de ser em Java?

Por que todos que já fiz foi em java, e outra linguagem tirando C, C++ e PHP eu num sei ainda…rsrs

estou com o mesmo problema
estou ate procurando um programador para este serviço
conseguiu rafa ?

O amigo, consegui sim, em algumas imagens que to mexendo.
Estou usando API pra poder tratar a imagem

o legal
qual seu email?
estou precisando desenvolver um programa que usa isto
tem tempo livre para pegar um trabalho extra?

ola rafa tudo bem?
conseguiu terminar o seu trabalha na quebra de uma captha?
estou precisando fazer o mesmo
e gostaria de contratar para este servico
de um retorno
vamos conversar
obrigado
waltermansur@gmail.com