Lucas Teixeira

@lucastex

Solr 1.4, mais que pronto

com 6 comentários

Pra quem acompanha a lista de discussões e o andamento do projeto, o Solr 1.4 já está prontinho para ser lançado tem algum tempo. O pessoal de dev estava apenas esperando o lançamento do Lucene 2.9 para oficializar o lançamento.

Quando então foi lançado, o pessoal do Solr empacotou o framework como RC, disponibilizou para download e na hora do lançamento (pra ser mais preciso, um dia antes), dois bugs significativos foram levantados no Lucene 2.9. A equipe do Solr os avaliou com calma, entrou em alinhamento com os devs do Lucene (alguns fazem parte de ambas as equipes) e decidiram por bem aguardar o Lucene 2.9.1 para efetuar o anúncio oficial do Solr 1.4.

Pois bem, com o lançamento oficial do Lucene 2.9.1 hoje a tarde, o pessoal do Solr já correu, e empacotou em uma versão final a release tão esperada, 1.4.

Amanhã, dia 07, será feito o lançamento final do Solr 1.4 sem mais delongas. Pois bem, é só aguardar! Mas se você quiser dar uma olhadinha antes, é só baixar os pacotes antes de serem replicados para o mirror central entrando aqui: http://people.apache.org/~gsingers/solr/1.4.0/.

Eu, em uma olhada muito, mas muito rápida por cima de algumas funcionalidades do Solr 1.4 (direto no wiki), levantei alguns pontos e encaminhei na lista de e-mails dos colaboradores da empresa em que trabalho. Não estão agrupados, muito menos organizados, mas segue como esboço e rascunho de um post que valeria a pena.

  • SolrServer – SolrJ HTTP
    • Configuração
      • Timeout
      • Quantidade de retentativas
    • SolrJ altamente evoluído para criação da queries e integrado aos searchcomponents
  • DataImportHandler
    • Transformers
      • Clob Transformer: Permite pegar dados direto de colunas clob no banco de dados
      • HTML Stripper: Atua em campos com conteúdo HTML, removendo tags e deixando apenas o conteúdo
    • Agora é possível usar o DIH indexando até conteúdos de um ‘datasource’ de e-mail, deixando ele fazer pooling em um e-mail e indexando o que chega.
    • Eventos callback após indexação
  • Replicação
    • Configuração interna a aplicação – Funciona como um RequestHandler
    • Dashboard de administração, permite ver como estão as replicações, qual indice está em cada nó, status do download de novos indices
    • Permite replicação interna, via HTTP, não sendo mais necessário usar apenas rsync
      • Com isso, possibilidade de usar em windows
      • Menos configuração de infra estrutura
      • Maior visibilidade do status da replicação
  • Indexação
    • indexação de grandes quantidades de documentos via streaming
      • conexão é aberta com o master, e permanece assim enquanto necessário.
    • Anotação @Field para poder adicionar um POJO direto ao índice, sem ter que transformar em SolrInputDocument
  • Componentes de busca (alguns presentes no 1.3 completos, outros eram beta, outros nem existiam)
    • Sugestão de busca
    • Spelling
    • Highlight
  • Resposta da busca em vários novos formatos
    • php nativo
    • json (já existia mas não era oficial)
    • xml (normal)
    • ruby

E muito mais…

Postado por Lucas Teixeira

November 9th, 2009 at 10:37 pm

Postado em Solr

Com as tags , , , , , ,

6 Respostas a 'Solr 1.4, mais que pronto'

Receber novos comentários por RSS or TrackBack to 'Solr 1.4, mais que pronto'.

  1. Post pré-release do #solr 1.4 -> http://bit.ly/1W0fEx (Please RT)

    Lucas Teixeira

    9 Nov 09 at 22:37

  2. Lucas Teixeira

    9 Nov 09 at 22:38

  3. RT @lucastex Post pré-release do #solr 1.4 -> http://bit.ly/1W0fEx

    Fabiano Milani

    9 Nov 09 at 23:13

  4. @lucabastos viu meu post de ontem? http://bit.ly/1W0fEx :)

    Lucas Teixeira

    10 Nov 09 at 07:19

  5. Olá Lucas,

    Foram significativas as melhorias de performance na indexação e em facets que é um recurso muito útil.

    Agora, o Solr é uma plataforma ainda mais escalável out-of-the-box.

    Obrigado pelo resumo!

    Michel Bottan

    10 Nov 09 at 11:23

  6. @Michel,

    Com certeza, alguns pontos práticos muito importante foram enfim adotados, como replicação de indices via HTTP, não mais dependendo de uma shell/resposta em diversos formatos, componentes mais bem trabalhados/solrj evoluído.

    Como você disse, só potencializou o fwk :)

    Valeu!

    Lucas Teixeira

    10 Nov 09 at 11:37

Deixe um comentário

Get Adobe Flash playerPlugin by wpburn.com wordpress themes