Blz, galera
eu tô desenvolvendo um sistema que funciona como um repositório de arquivos. Como repositório, além de ter como função essencial armazenar, deve possuir um excelente sistema de buscas. No processo de adição de um arquivo, o usuário deverá digitar palavras-chave a fim de facilitar as buscas. Entretanto, eu não sei qual a forma correta de armazenar as palavras (uma tabela associando palavra e arquivo?) e nem como fazer a pesquisa. Alguém possui algum material sobre isso que possa me nortear?
Eu pus aqui no fórum de BD pq acredito que as palavras sejam armazenadas num BD, só que de forma diferente da que eu sugeri acima.
Vlw.
http://lucene.apache.org/
Veja se seu banco de dados suporta “Full-text search” .
Suporta, mas eu li e não entendi o que Lucene faz. Ele tem essa função?
O Lucene serve para você procurar em alguma coisa para a qual exista um filtro. Por exemplo, se você quer achar coisas que estão em arquivos .PDF e existir um filtro para PDFs, então ele deve encontrar o arquivo PDF que contém as palavras desejadas.
O recurso de Full-text search de um banco de dados serve para procurar alguma coisa em determinados campos de uma tabela; usualmente esses campos são do tipo VARCHAR, NVARCHAR ou TEXT (CLOB).
Não li com muita atenção o que você desejava, mas não se esqueça que ambas as tecnologias exigem índices que podem ter o mesmo tamanho ou serem até um pouco maiores que os arquivos ou campos indexados, quando você for dimensionar o espaço necessário (para comprar espaço em disco, por exemplo).