Sugestões Projeto IA/RP

4 respostas
kuchma

Olá pessoal,

Estou pra fazer um trabalho de Reconhecimento de Padroes usando RNA. O trabalho em si nao eh complicado: uma hipotese, uma massa de dados e depois brincar com a rede, para ver como ela se comporta em relacao a hipotese e as amostras de dados.

O trabalho em si nao eh o problema. O “x” da questao eh que eu preciso de DADOS para serem analisados. Como as amostras terao de ser coletadas pelo grupo, estive matutando em analisar alguma coisa cuja coletagem de amostra fosse simples. Nao quero ter que sair na rua entrevistando mais de 500 pessoas p.ex., para consguir uma amostragem de caracteristicas relacionadas a, p.ex., pratica de esportes.

Sendo assim imaginei utilizar caracteristicas de algo de forma que eu conseguisse criar um robozinho para fazer essa coletagem para mim. Exemplo: digamos que minha ideia seja “sites com muitas figuras tem como cor de fundo branco, sites com poucas figuras tem como cor de fundo preto” (sim, eu sei que nao faz sentido). Nesse caso eu poderia criar um programa que navegasse em tantos sites quanto eu quisesse e catalogasse essas informacoes. Dessa forma nao apenas meu trabalho seria mais simples como eu conseguiria um numero de amostras muito maior do que o “metodo bracal”.

Entenderam o que eu quis dizer? Alguma sugestao, critica, ideia? Como falei, o trabalho em si eh tranquilo, minha pedra no sapato eh como obter as tais amostras. :smiley:

Marcio Kuchma

4 Respostas

smota

Opa …

Pq você não encontra alguma coisa pra pesquisar usando a API do Google? vc teria muitos dados e é um tema interessante.

Tipo, ache uma pagina e extraia dela as palavras do texto, procure por padrões de busca que façam essa página ser retornada nos primeiros 10 registros da busca (1ª página) … tente aplicar esse padrão em outra página sem nada a ver, se der certo é um padrão mesmo, se não foi só coincidência.

Para isso você pode por exemplo assumir que palavras em negrito (b ou classe bold) sao mais importantes no texto, letras maiores sao titulos e por ai vai … ehehehe, acho que da um bom trabalho, seria mais facil se a internet fosse alguma padrao XML e nao o famoso HTML.

mas é uma ideia

[]s

isneiqui

é necessário realmente que vc mesmo colete os dados?
Pq nao usar alguma das bases de dados já utilizadas para Aprendizado de Máquina? Aquelas usadas para benchmark em vários artigos científicos…
um ótimo repositório dessas bases pode ser encontrado em:

http://www.ics.uci.edu/~mlearn/MLSummary.html

Como existem vários testes realizados com essas bases fica até mais fácil vc comparar seus resultados com outros…

abraços.

vamorim

Marcio, muito interessante seu trabalho. É em trabalhos assim que se descobre que padrões do tipo “pessoas que compram salgadinhos também tomam muito refrigerante”. Todo dono de supermercado hoje já sabe disso. Não é àtoa que eles colocam esses produtos bem próximos, em seus estabelecimentos…

Procure por “Web Mining” (versão de Data Mining para a Web). :wink:

lucianodesantana

:evil: tb vou fazer um trabalho de RP, e tou pensando em fazer dele o meu tema de TCC, voltado para o reconhecimento de assinaturas… o q vcs acham??

Dicas?

Me ajudem aí!!

Criado 16 de setembro de 2004
Ultima resposta 1 de mar. de 2008
Respostas 4
Participantes 5