Dicionário

Pretendo desenvolver uma aplicação em que após importarmos um texto, essa aplicação diz-nos qual a lingua predominante nesse texto. Tenho que pelo menos avaliar se está em português ou inglês.

Alguma ideia?

Obrigado

Bom, uma lista com umas mil palavras de cada idioma deve resolver.

VELO

        Com certeza é um desafio subjetivo e as pessoas vão dar algumas soluções diferentes, mas também é muito interessante e poderíamos perder mto tempo discutindo um bom método para resolver isso, nenhuma idéia será totalmente segura, pois hoje em dia nenhuma língua é pura...principalmente o português....

      A minha dica seria parecida com a do [b]velo[/b], mas como existe a possibilidade de existirem sempre algumas palavras estrangeiras no meio do texto, o ideal seria dar o resultado em porcentagens, e não listar mtas palavras de uma língua, e sim procurar por palavras que caracterizam a língua como pronomes pessoais, ou então verbos comuns(ser/to be)....

Boa sorte e dps diz como vc fez!!!^^

Entre no site abaixo e dê uma fuçada. É uma professora minha quando eu tava na facul que tem estudos na área de reconhecimento de linguagem natural, ou coisa assim (Se ela ler esse “ou coisa assim” ela vai tentar revogar meu diploma :lol: )
www.dc.ufscar.br/~lucia

Palavra-chave pro Google:
“natural language processing”

Tem um grupo português de linguistas e cientistas da computação da Universidade do Minho que faz pesquisa em processamento de português e tradução entre inglês e português…talvez você ache alguma coisa.

http://www.linguateca.pt