| Autor |
Mensagem |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 11/02/2005 22:16:51
|
cezarsg
JavaChild
Membro desde: 28/04/2003 09:57:38
Mensagens: 129
Localização: curitiba
Offline
|
pessoal, gostaria de saber como vcs implementam a opçãio de busca/pesquisa de conteúdo do próprio site web... se o conteúdo deve estar num banco de dados ou em arquivos html mesmo?
tipo, quero disponibilizar um campo onde o usuário coloque palavras chave, daí retorne o links paras as páginas encontradas.
|
|
|
 |
|
|
![[Post New]](/templates/default/images/icon_minipost_new.gif) 11/02/2005 22:41:23
|
danieldestro
Moderador
![[Avatar]](/images/avatar/a5bfc9e07964f8dddeb95fc584cd965d.png)
Membro desde: 04/09/2002 17:26:16
Mensagens: 6667
Localização: São Paulo / Catanduva
Offline
|
O legal seria ter o conteúdo fora do seu HTML, seja em XML, seja em banco de dados.
|
gotjava?
Doe sangue
What You See Is What You Get!
Apostilas de Java grátis!
RefsCALL - Bandeira Eletrônica para Árbitro de Futebol |
|
|
 |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 12/02/2005 11:05:30
|
kuchma
Moderador
![[Avatar]](/images/avatar/85422afb467e9456013a2a51d4dff702.jpg)
Membro desde: 17/01/2003 19:36:16
Mensagens: 1231
Localização: Curitiba - PR
Offline
|
Acho que o Lucene pode ajudar. Da uma olhada: http://jakarta.apache.org/lucene/docs/index.html
Marcio Kuchma
This message was edited 1 time. Last update was at 14/02/2005 17:12:17
|
E tu, Belém-Efrata, pequena demais para figurar como grupo de milhares de Judá, de ti me sairá o que há de reinar em Israel, e cujas origens são desde os tempos antigos, desde os dias da eternidade. Mq 5:2, Miquéias, 750 AC aprox. |
|
|
 |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 12/02/2005 11:34:04
|
pcalcado
Moderador
![[Avatar]](/images/avatar/110eec23201d80e40d0c4a48954e2ff5.jpg)
Membro desde: 08/03/2004 17:19:35
Mensagens: 5174
Localização: Sydney - Australia
Offline
|
cezarsg wrote:pessoal, gostaria de saber como vcs implementam a opçãio de busca/pesquisa de conteúdo do próprio site web... se o conteúdo deve estar num banco de dados ou em arquivos html mesmo?
Depende. Se seu conteúdo estiver num SGBD, você faz uma busca no SGBD, aproveitando apra fazer toooodas aquelas otimizações bizarras porque essas consultas são caras pra caramba.
Se você estiver usando arquivos, o Lucene pdoe te ajudar bastante, como o Kuchma disse.
[]s
|
Phillip Calçado "Shoes"
http://fragmental.tw/
http://blog.fragmental.com.br/
"It is unfortunate that much of what is called 'object-oriented programming today is simply old style programming with fancier constructs." - Alan Kay |
|
|
 |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 14/02/2005 16:49:59
|
omnia
Entusiasta Java
Membro desde: 09/01/2004 08:20:37
Mensagens: 23
Offline
|
Se vc for usar o lucene para implementar a busca utilizando indices para o conteúdo estático, é uma boa escolha, o lucene é uma ferramenta extremamente poderoza. Porém, atente que vc deverá fazer algum programa que extraia a informação util do seu HTML, não é interessante vc colocar no índice tags HTML, certo? Além disso depois de ter extraído o texto, vc deverá aplicar um stemmer para lingua portuguesa que otimizará muito a qualidade das suas buscas. O stemmer vai extrair apenas a informação útil do texto já extraído do html. Por exemplo, artigos como O, A, um, uma ou preposições não são úteis para o índice e devem ser descartados.
[]'s
renato
|
Sapientia Vincit |
|
|
 |
|
|