Pesquisa interna no site  XML
Índice dos Fóruns » Desenvolvimento Web
Autor Mensagem
cezarsg
JavaChild

Membro desde: 28/04/2003 09:57:38
Mensagens: 129
Localização: curitiba
Offline

pessoal, gostaria de saber como vcs implementam a opçãio de busca/pesquisa de conteúdo do próprio site web... se o conteúdo deve estar num banco de dados ou em arquivos html mesmo?

tipo, quero disponibilizar um campo onde o usuário coloque palavras chave, daí retorne o links paras as páginas encontradas.
danieldestro
Moderador
[Avatar]

Membro desde: 04/09/2002 17:26:16
Mensagens: 6667
Localização: São Paulo / Catanduva
Offline

O legal seria ter o conteúdo fora do seu HTML, seja em XML, seja em banco de dados.

gotjava?
Doe sangue
What You See Is What You Get!
Apostilas de Java grátis!
RefsCALL - Bandeira Eletrônica para Árbitro de Futebol
[WWW]
kuchma
Moderador
[Avatar]

Membro desde: 17/01/2003 19:36:16
Mensagens: 1231
Localização: Curitiba - PR
Offline

Acho que o Lucene pode ajudar. Da uma olhada: http://jakarta.apache.org/lucene/docs/index.html


Marcio Kuchma

This message was edited 1 time. Last update was at 14/02/2005 17:12:17


E tu, Belém-Efrata, pequena demais para figurar como grupo de milhares de Judá, de ti me sairá o que há de reinar em Israel, e cujas origens são desde os tempos antigos, desde os dias da eternidade. Mq 5:2, Miquéias, 750 AC aprox.
[WWW] [ICQ]
pcalcado
Moderador
[Avatar]

Membro desde: 08/03/2004 17:19:35
Mensagens: 5174
Localização: Sydney - Australia
Offline

cezarsg wrote:pessoal, gostaria de saber como vcs implementam a opçãio de busca/pesquisa de conteúdo do próprio site web... se o conteúdo deve estar num banco de dados ou em arquivos html mesmo?


Depende. Se seu conteúdo estiver num SGBD, você faz uma busca no SGBD, aproveitando apra fazer toooodas aquelas otimizações bizarras porque essas consultas são caras pra caramba.

Se você estiver usando arquivos, o Lucene pdoe te ajudar bastante, como o Kuchma disse.

[]s

Phillip Calçado "Shoes"
http://fragmental.tw/
http://blog.fragmental.com.br/
"It is unfortunate that much of what is called 'object-oriented programming today is simply old style programming with fancier constructs." - Alan Kay
[Email] [WWW] [Yahoo!] [MSN]
omnia
Entusiasta Java

Membro desde: 09/01/2004 08:20:37
Mensagens: 23
Offline


Se vc for usar o lucene para implementar a busca utilizando indices para o conteúdo estático, é uma boa escolha, o lucene é uma ferramenta extremamente poderoza. Porém, atente que vc deverá fazer algum programa que extraia a informação util do seu HTML, não é interessante vc colocar no índice tags HTML, certo? Além disso depois de ter extraído o texto, vc deverá aplicar um stemmer para lingua portuguesa que otimizará muito a qualidade das suas buscas. O stemmer vai extrair apenas a informação útil do texto já extraído do html. Por exemplo, artigos como O, A, um, uma ou preposições não são úteis para o índice e devem ser descartados.

[]'s

renato

Sapientia Vincit
 
Índice dos Fóruns » Desenvolvimento Web
Ir para:   
Powered by JForum 2.1.8 © JForum Team