Ajuda/Dica com Expressão Regular (Regex)

1 resposta
edsonlopes

Olá pessoal, eu estou querendo listar os links de uma página, e até aí tudo anda bem, eu estou usando essa expressão:

link = Pattern.compile("href=\"[^>]*\">");

Como falei, até aqui, tudo bem, está realmente funcionando, mas quando eu tento separar somente um determinado tipo de Link, Exemplo: Que contenham a substring “ALUGUEL” no corpo do link, eu não consigo…

O link completo é como este:
http://openwatto.com/?link=pesquisa&acao=PESQUISA&FINALIDADE=ALUGUEL&ORDEM=VALOR&TIPO=BARRAC�O

E no caso, gostaria de recolher todos os links do site que contenham “ALUGUEL”, ou seja, separar o “joio do trigo” diretamente nos resultados recolhidos pelo Regex…

Não sei mais o que tentar, e gostaria de uma luz do pessoal…
(Eu tento: href=".ALUGUEL[^>]"> e dá certo na ferramenta online, mas quando coloco no sistema, ele não funciona… Não sei se esta é a melhor forma ou não…)

1 Resposta

edsonlopes

Até agora, acho que esse foi o mais próximo que consegui chegar:

<a href="[^>]ALUGUEL[^>]">(.*?)

Eu testei nesses dois sistemas online:
http://www.piazinho.com.br/exemplos.html#1
http://regexpal.com/

<a href="http://openwatto.com/?link=pesquisa&acao=PESQUISA&FINALIDADE=VENDA&ORDEM=VALOR&TIPO=CASA" class="linksPesquisa">CASA - 405</a><br /> <a href="http://openwatto.com/?link=pesquisa&acao=PESQUISA&FINALIDADE=LOCACAO&ORDEM=VALOR&TIPO=CH�CARA" class="linksPesquisa">CH�CARA - 40</a><br /> <a href="http://openwatto.com/?link=pesquisa&acao=PESQUISA&FINALIDADE=VENDA&ORDEM=VALOR&TIPO=COMERCIAL" class="linksPesquisa">COMERCIAL - 15</a><br /> <a href="http://openwatto.com/?link=pesquisa&acao=PESQUISA&FINALIDADE=COMPRA&ORDEM=VALOR&TIPO=CONDOM�NIO" class="linksPesquisa">CONDOM�NIO - 1</a><br /> <a href="http://openwatto.com/?link=pesquisa&acao=PESQUISA&FINALIDADE=VENDA&ORDEM=VALOR&TIPO=EDICULA" class="linksPesquisa">EDICULA - 2</a><br /> <a href="http://openwatto.com/?link=pesquisa&acao=PESQUISA&FINALIDADE=VENDA&ORDEM=VALOR&TIPO=F�BRICA" class="linksPesquisa">F�BRICA - 1</a><br />

Assim que implementar esta Regex, e claro, funcionar com o Java, eu aviso aos colegas, ok.

Criado 19 de março de 2010
Ultima resposta 19 de mar. de 2010
Respostas 1
Participantes 1