Olá pessoal, estou a desenvolver um projeto de TCC do meu curso técnico de programação, então tive a ideia de um projeto, a ideia básica é a seguinte:
Desenvolver uma aplicação para celular(preferência em SO Android) que utilize a câmera do próprio celular para capturar imagens de textos, e que por um processo o celular lê-se este texto em “voz alta”, para auxiliar deficientes visuais na leitura.
Mas n sei bem como fazer isso, tenho apenas uma ideia do processo, ai queria a ajuda de vocês!
Até agora o que sei é isso:
Primeiro a câmera deve capturar as imagens e um sistema fazer a decodificação de imagem pra texto(um sistema OCR) e outro sistema fazer a decodificação de texto pra áudio(uma API), tudo isso em tempo real de execução.
Estava lendo coisas na internet e descobri que posso usar um sistema OCR pro reconhecimento do texto na imagem e uma API chamada java speech API pra transformar o texto em áudio!
Mas n tenho a mínima ideia de como fazer isso e gostaria que me ajudassem
OBS: possuo um smartphone, Xperia mini pro sk17a, com SO android 2.3, ele possui uma câmera de 5 Mp, melhor que mt câmera de 16 mp… e creio que isso pode ajudar na hora do reconhecimento com a câmera!
valeu gente fuis!!
A ideia é boa, porém para um projeto de TCC tem que se ver muita coisa:
É para deficientes visuais certo? Porém acho dificil ver um deficiente visual com um celular que já nao é bem adaptado para o caso;
Todo o menu, interacoes, deve-se levar em conto este foco também, e deve descrever dificuldades dos deficientes visuais, e como vc trata isso no seu projeto;
Só pelo fato de converter o texto de uma foto para um texto na tela, por exemplo, já acho um bom projeto, e ainda utilizar a leitura, e para Android (paixao pessoal), gostei muito do seu projeto, parabéns.
Sobre o desenvolvimento, acredito que vc nao terá muitos problemas, principalmente por já utilizar as APIs prontas.
Vlw Bertan, disso tudo ai eu sei… mas como ta no papel ainda, to me preocupando mais com essa parte ai que citei, que é a mais complexa! e e eu to mt afim de desenvolver esse projeto! Tem uma amiga da minha classe que tem um problema genético de visão, ela só tem a visão periférica e menos de 15% da visão central, ou seja ela tem mts dificuldades em várias coisas, inclusive em ler, ela precisa de um aparelho para ampliar em 100x ou 200x o tamanho das letras para poder ler, então tive essa ideia que poderia ajudar mt!
E sobre as interações e tudo mais, tem um amigo meu que está desenvolvendo uma aplicação na qual é possível controlar um PC desktop por comandos de voz e com interações dinamicas com o usuário por áudio, ele disse que poderia ser possível passar isso pra celular sem mts dificuldades!
Mas o principal problema pra mim agr é de como passar o texto da imagem pra texto na tela! Atualmente n tenho ideia de como fazer isso, e por isso vim aqui no GUJ pedir ajuda da galera!
vlw ai!
Estive pesquisando sobre um OCR para utilizar no Android, mas é meio complicado… Os bons sao pagos (utiliza cloud pro processamento), e os free sao basicamente ports utilizando JNI do Tesseract (acho que é da Google)… Um mais ou menos que encontrei, foi o Docs da Google, porém pelo que entendi ele tem limite diário para utilizacao, se nao houver, é mais facil enviar o arquivo que ele faz a análise e retorna o texto…
Pelas minhas pesquisas, ainda nao há ferramentas 100%, sempre deixam a desejar… Um simples teste que fiz, com um print de um texto “My text is great.”, o Docs só retornou: “text is great.”…
Vou comecar a estudar este assunto, me interessei pela situacao, e como entusiasta, já tenho alguns projetos que me seriam uteis este tipo de processamento.
Se descobrir novas tecnologias, ou maneiras para realizar o processamento, compartilharei com a comunidade.