Roi opencv java

Ola pessoal, estou fazendo um trabalho sobre região de interesse e tenho que encontrar a regiao de interesse e os digitos nas imagens usando a biblioteca opencv. Alguem poderia dar uma dica de como posso fazer, pois não sou da area de computação.

Grata.

Tem como vc postar uma ou duas imagens de exemplo?

Claro!!


Bom, podia postar mais imagens?
O Vinicius Godoy pediu mais que uma, justamente porque só com uma imagem é difícil saber exatamente que tipos de dificuldades o programa vai ter para analisar as imagens.
Por exemplo, se descobrirmos que os dígitos ficam sempre no mesmo local da imagem, a localização da região de interesse (ROI) será bem mais simples que, por exemplo, naquele famoso problema de ler as placas de carros em uma foto tirada na estrada.
Ou então se os dígitos forem pretos em algumas imagens e brancos em outras, porque os problemas são um pouco diferentes. E assim por diante.

mais duas imagens!




Ta paracendo mais alguém que quer um quebrador de captcha do google. :lol: :lol: :lol: :lol:

Não parece ser isso.
Em vez disso, aparentemente é para você poder rastrear uma barra de aço (ou outro material que vem em lingotes, não sei que material é esse só de ver) dentro de uma fábrica.
O problema parece estar simplificado, porque de alguma forma (talvez por algum sensor) a imagem é capturada quando a barra passa exatamente nessa posição.
Entretanto, há um complicador aí, porque pelo que vi os fornecedores dos lingotes são diferentes e imprimem o texto com fontes um pouco diferentes.

Ela só precisa do ROI. Apesar de que, acho que se você submeter essa imagem do jeito que está a um software de OCR, é bem provável que ele já detecte corretamente a imagem.

Uma das formas de achar esse ROI seria limiarizar essa imagem. O trecho do meio sempre aparece bastante escuro, é provável que isso já segmente bem a imagem.

[quote=entanglement]Não parece ser isso.
Em vez disso, aparentemente é para você poder rastrear uma barra de aço (ou outro material que vem em lingotes, não sei que material é esse só de ver) dentro de uma fábrica.
O problema parece estar simplificado, porque de alguma forma (talvez por algum sensor) a imagem é capturada quando a barra passa exatamente nessa posição.
Entretanto, há um complicador aí, porque pelo que vi os fornecedores dos lingotes são diferentes e imprimem o texto com fontes um pouco diferentes. [/quote]legal. [=

Eu olhei e tive a impressão que estavam igual a uns captchas que vi por aí. Bom saber. [=

Uma outra forma seria realizar uma busca por contornos. Tem um ótimo artigo sobre isso aqui:
http://www.aishack.in/2010/01/an-introduction-to-contours/

olhei o link, mais ainda não estou conseguindo achar a roi e nem identificar os digitos das imagens…Alguém poder ajudar??

Estudei um pouco ontem e estou tentando fazer o que o viniGodoy falou, primeiro binarizar a imagem,mas n esta dando muito certo, alguem teria o codigo ou algum livro,link para indicar???

obrigada.

Vou te adiantar uma coisa: Não é fácil.

Você vai ter que pesquisar várias técnicas, e tentar combina-las. É assim com toda aplicação de visão computacional, até por isso, não se vê aplicações dessa em todo lugar. E ter dificuldade é perfeitamente normal, principalmente se você estiver em suas primeiras aplicações.

O seu caso é relativamente bem controlado. De cara você poderia descartar em cima e embaixo e aos lados da imagem por ela ser bem comportada, e então processar após isso.

Você pode tentar converter a imagem num outro espaço de cor, como o HSV, para tentar identificar o amarelo dos número (tem que ser uma faixa de amarelos, pois tanto a tinta quanto a iluminação mudam).

Agora, não dá para ficar te enviando exemplos, pois isso envolveria eu mesmo parar, instalar a opencv, pegar suas imagens e fazer o trabalho para você. Infelizmente, eu não teria tempo para isso.