<?xml version="1.0" encoding="ISO-8859-1"?>
<rss version="2.0">
	<channel>
		<title><![CDATA[Últimas mensagens do tópico "Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação"]]></title>
		<link>http://www.guj.com.br/posts/list/17.java</link>
		<description><![CDATA[Últimas mensagens enviadas no tópico "Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação"]]></description>
		<generator>JForum - http://www.jforum.net</generator>
			<item>
				<title>Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ Olá<br /> <br /> O Lucene (open-source search software) é uma ferramenta que tem lugar em um grande número de aplicações web e quem não conhece está perdendo tempo. Ontem saiu a nova versão com novidades que merecem aparecer aqui.<br /> <br /> A grande mudança acontece com o novo algoritmo de indexação que agora trabalha na memória e consegue enorme melhoria no desempenho. A simples troca do jar do Lucene 2.2 pelo novo jar do Lucene 2.3 (sem recompilar nada) já mostra um excelente ganho de desempenho na indexação que pode atingir até 500%.<br /> <br /> Algumas informações tiradas de <a class="snap_shots" href="http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_3_0/CHANGES.txt" target="_blank" rel="nofollow">http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_3_0/CHANGES.txt</a><br /> <br /> Os defaults do IndexWriter mudaram de modo a maximizar a velocidade de indexação.<br /> 1) Agora o IndexWriter usa a memória, 16 MB por default)  (call IndexWriter.setMaxBufferedDocs to get backwards compatible behavior).  <br /> <br /> 2) ConcurrentMergeScheduler serve para executar merges usando background threads (call IndexWriter.setMergeScheduler(new SerialMergeScheduler()) to get backwards compatible behavior).<br />    <br /> 3) Os merges são escolhidos baseados no tamanho em bytes de cada segmento ao invés do número de documentos (call IndexWriter.setMergePolicy(new LogDocMergePolicy()) to get    backwards compatible behavior).<br /> <br /> <br /> O download pode ser veito em em <a class="snap_shots" href="http://lucene.apache.org/#24+January+2008+-+Lucene+Java+2.3.0+available" target="_blank" rel="nofollow">http://lucene.apache.org/#24+January+2008+-+Lucene+Java+2.3.0+available</a><br /> <br /> Vejam mais informações em <a class="snap_shots" href="http://www.infoq.com/news/2008/01/lucene-23-mahout" target="_blank" rel="nofollow">http://www.infoq.com/news/2008/01/lucene-23-mahout</a><br /> <br /> []s<br /> Luca]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/427144/lancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/427144/lancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Fri, 25 Jan 2008 11:32:38]]> GMT</pubDate>
				<author><![CDATA[ Luca]]></author>
			</item>
			<item>
				<title>Re:Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ Caramba, essa estatística não está muito irreal? Vou testar aqui numa aplicação minha para ver se o ganho de indexação pelo menos é metade disso.<br /> Testaste se está bem rápido mesmo? Uso Lucene desde as versões 1.X e já estava um pouco desapontado pela performance.<br /> Aliás, alguém sabe como anda o Hadoop?<br /> <br /> Até!]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/427214/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/427214/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Fri, 25 Jan 2008 13:47:21]]> GMT</pubDate>
				<author><![CDATA[ maquiavelbona]]></author>
			</item>
			<item>
				<title>Re:Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ A mudancas do lucene de 2.0 para 2.1 e 2.1 para 2.2 tambem anunciaram grandes ganhos de performance. Em uma delas o formato binario do indice foi totalmente modificado e ficou incompativel (mas ele mesmo convertia se precisasse).  O Lucene é um dos projetos open source mais incriveis que conheco, e é uma grande aplicação de conceitos academicos.<br /> <br /> Hadoop continua encubado, e esta sendo utilizado em um projeto recem lancado, o Manhount, que tem um pessoal de grandes universidades envolvidos.<br /> <br /> Maquiavel, o lucene e qualquer indexador sempre vai ser mais lento para escrever do que pra ler. Pra mim a leitura pelo lucene sempre foi incrivelmente rapida.]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/427223/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/427223/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Fri, 25 Jan 2008 13:56:46]]> GMT</pubDate>
				<author><![CDATA[ Paulo Silveira]]></author>
			</item>
			<item>
				<title>Re:Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ [quote=Paulo Silveira]A mudancas do lucene de 2.0 para 2.1 e 2.1 para 2.2 tambem anunciaram grandes ganhos de performance. Em uma delas o formato binario do indice foi totalmente modificado e ficou incompativel (mas ele mesmo convertia se precisasse).  O Lucene é um dos projetos open source mais incriveis que conheco, e é uma grande aplicação de conceitos academicos.[/quote]<br /> Realmente mudou mas não vi ganhos aparentes. Deve ser bem incrível mesmo por dentro, mas ainda não tenho capacidade de entender por dentro a fundo a maneira que faz os índices.<br /> [quote=Paulo Silveira]Hadoop continua encubado, e esta sendo utilizado em um projeto recem lancado, o Manhount, que tem um pessoal de grandes universidades envolvidos.[/quote]<br /> Então não saiu muito do que estava a um ano atrás.<br /> [quote=Paulo Silveira]Maquiavel, o lucene e qualquer indexador sempre vai ser mais lento para escrever do que pra ler. Pra mim a leitura pelo lucene sempre foi incrivelmente rapida.[/quote]<br /> Para ler estou bem satisfeito, na escrita já sabia que era bem mais lento, mas ainda esperava algo mais. Geralmente faço criação de pouco em pouco dos índices, assim não sobrecarrego o sistema. Não gosto de comparar coisas, mas quando fiz testes do MS IndexServer e Lucene 1.9 na época, o IndexServer e o IFilter não comiam um processador inteiro para eles e faziam a indexação em menor tempo (não tão menor). Tinha um projeto que a primeira indexação tinha que indexar 120GB de pdfs, não creio que seja culpa só do Lucene e do PDFBox, e talvez o que eu fiz na época também não era tão otimizado, mas mesmo assim era mais simples integrar o Lucene ao portal em PHP do que o IndexServer.<br /> <br /> Valeu pelas respostas.<br /> <br /> Até!]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/427246/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/427246/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Fri, 25 Jan 2008 14:14:06]]> GMT</pubDate>
				<author><![CDATA[ maquiavelbona]]></author>
			</item>
			<item>
				<title>Re:Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ Com certeza, o Lucene é um projeto impressionante. Não só para a comunidade Java, mas para o povo que trabalha com php (como o maquiavel citou) e o pessoal de ruby com o ferret e o lucene4c para C. Acredito que tenha suporte para outras linguagens, mas só trabalhei com essas.<br /> <br /> Põe projeto de sucesso nisso <img src="http://www.guj.com.br/images/smilies/3b63d1616c5dfcf29f8a7a031aaa7cad.gif" border="0"><br /> <br /> Um abraço,]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/427454/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/427454/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Fri, 25 Jan 2008 20:07:21]]> GMT</pubDate>
				<author><![CDATA[ glaucioguerra]]></author>
			</item>
			<item>
				<title>Re:Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ Lucene é o tipo de projeto que o cara poderia ter ficado rico (ou ganho uma bela grana), mas preferiu fazer um projeto open-source e gratuito. Tem que tirar o chapéu para o autor e para o projeto, que é realmente fenomenal. Outro que também me impressiona bastante é o JGroups.<br /> <br /> ]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/427462/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/427462/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Fri, 25 Jan 2008 22:05:50]]> GMT</pubDate>
				<author><![CDATA[ saoj]]></author>
			</item>
			<item>
				<title>Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ Desculpe a ignorancia mas pra que serve o lucene?]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/428511/lancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/428511/lancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Mon, 28 Jan 2008 20:09:30]]> GMT</pubDate>
				<author><![CDATA[ Daniel.F]]></author>
			</item>
			<item>
				<title>Re:Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ Lucene é um servidor de indexação, servindo para fazer principalmente full-text search.<br /> Caso queira saber mais do projeto: <a class="snap_shots" href="http://lucene.apache.org/" target="_blank" rel="nofollow">http://lucene.apache.org/</a><br /> Especificamente para java: <a class="snap_shots" href="http://lucene.apache.org/java/docs/index.html" target="_blank" rel="nofollow">http://lucene.apache.org/java/docs/index.html</a><br /> <br /> Até!]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/428513/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/428513/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Mon, 28 Jan 2008 20:28:27]]> GMT</pubDate>
				<author><![CDATA[ maquiavelbona]]></author>
			</item>
			<item>
				<title>Re:Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ Olá Pessoal!<br /> Alguem ai sabe onde posso encontrar um tutorial sobre o Lucene??? Ou se existe algum livro???<br /> <br /> valeu!]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/453347/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/453347/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Fri, 14 Mar 2008 09:41:01]]> GMT</pubDate>
				<author><![CDATA[ tr_jr]]></author>
			</item>
			<item>
				<title>Re:Lançada versão 2.3 do Lucene com melhoria de até 500% no desempenho da indexação</title>
				<description><![CDATA[ Existe o livro "Manning - Lucene In Action"]]></description>
				<guid isPermaLink="true">http://www.guj.com.br/prepost/80410/540609/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</guid>
				<link>http://www.guj.com.br/prepost/80410/540609/relancada-versao-23-do-lucene-com-melhoria-de-ate-500-no-desempenho-da-indexacao
</link>
				<pubDate><![CDATA[Sun, 17 Aug 2008 19:42:02]]> GMT</pubDate>
				<author><![CDATA[ mlobao]]></author>
			</item>
	</channel>
</rss>
