Projeto de Pesquisa - TCC - Reconhecimento de caractéres

Olá pessoal, estou a desenvolver um projeto de TCC do meu curso técnico de programação, então tive a ideia de um projeto, a ideia básica é a seguinte:
Desenvolver uma aplicação para celular(preferência em SO Android) que utilize a câmera do próprio celular para capturar imagens de textos, e que por um processo o celular lê-se este texto em “voz alta”, para auxiliar deficientes visuais na leitura.
Mas n sei bem como fazer isso, tenho apenas uma ideia do processo, ai queria a ajuda de vocês!
Até agora o que sei é isso:
Primeiro a câmera deve capturar as imagens e um sistema fazer a decodificação de imagem pra texto(um sistema OCR) e outro sistema fazer a decodificação de texto pra áudio(uma API), tudo isso em tempo real de execução.

Estava lendo coisas na internet e descobri que posso usar um sistema OCR pro reconhecimento do texto na imagem e uma API chamada java speech API pra transformar o texto em áudio!
Mas n tenho a mínima ideia de como fazer isso e gostaria que me ajudassem
OBS: possuo um smartphone, Xperia mini pro sk17a, com SO android 2.3, ele possui uma câmera de 5 Mp, melhor que mt câmera de 16 mp… e creio que isso pode ajudar na hora do reconhecimento com a câmera!
valeu gente fuis!!

Bom dia,

A ideia é boa, porém para um projeto de TCC tem que se ver muita coisa:

  • É para deficientes visuais certo? Porém acho dificil ver um deficiente visual com um celular que já nao é bem adaptado para o caso;

  • Todo o menu, interacoes, deve-se levar em conto este foco também, e deve descrever dificuldades dos deficientes visuais, e como vc trata isso no seu projeto;

Só pelo fato de converter o texto de uma foto para um texto na tela, por exemplo, já acho um bom projeto, e ainda utilizar a leitura, e para Android (paixao pessoal), gostei muito do seu projeto, parabéns.

Sobre o desenvolvimento, acredito que vc nao terá muitos problemas, principalmente por já utilizar as APIs prontas.

Sucesso!

[]`s
Bertan

Vlw Bertan, disso tudo ai eu sei… mas como ta no papel ainda, to me preocupando mais com essa parte ai que citei, que é a mais complexa! e e eu to mt afim de desenvolver esse projeto! Tem uma amiga da minha classe que tem um problema genético de visão, ela só tem a visão periférica e menos de 15% da visão central, ou seja ela tem mts dificuldades em várias coisas, inclusive em ler, ela precisa de um aparelho para ampliar em 100x ou 200x o tamanho das letras para poder ler, então tive essa ideia que poderia ajudar mt!
E sobre as interações e tudo mais, tem um amigo meu que está desenvolvendo uma aplicação na qual é possível controlar um PC desktop por comandos de voz e com interações dinamicas com o usuário por áudio, ele disse que poderia ser possível passar isso pra celular sem mts dificuldades!

Mas o principal problema pra mim agr é de como passar o texto da imagem pra texto na tela! Atualmente n tenho ideia de como fazer isso, e por isso vim aqui no GUJ pedir ajuda da galera!
vlw ai!

Blz,

Estive pesquisando sobre um OCR para utilizar no Android, mas é meio complicado… Os bons sao pagos (utiliza cloud pro processamento), e os free sao basicamente ports utilizando JNI do Tesseract (acho que é da Google)… Um mais ou menos que encontrei, foi o Docs da Google, porém pelo que entendi ele tem limite diário para utilizacao, se nao houver, é mais facil enviar o arquivo que ele faz a análise e retorna o texto…

Pelas minhas pesquisas, ainda nao há ferramentas 100%, sempre deixam a desejar… Um simples teste que fiz, com um print de um texto “My text is great.”, o Docs só retornou: “text is great.”…

Vou comecar a estudar este assunto, me interessei pela situacao, e como entusiasta, já tenho alguns projetos que me seriam uteis este tipo de processamento.

Se descobrir novas tecnologias, ou maneiras para realizar o processamento, compartilharei com a comunidade.

[]s
Bertan