HowTo & Tutorial: Suchen mit PHP/Solr in Lucene

Mittwoch, 13. Juli 2011

Mehere Solr Instanzen parallel betreiben (solr.xml)

Hin und wieder ergibt sich die Notwendigkeit, eine zweite Solr Instanz aufzubauen.
Etwa dann, wenn weitere Dokumente mit einer anderen Struktur indexiert werden sollen. Ein zusätzlicher Solr Index ist auch dann sinnvoll, wenn man zwischen Entwicklungsindex und Produktivindex trennen möchte; in diesem Zusammenhang auch, um neue Konfigurationen auf einer Instanz zu testen, während die zweite Instanz unverändert weiter läuft.
Im Idealfall kann man ad hoc zwischen beiden Konfigurationsalternativen wechseln.

Natürlich könnte man dazu diverse J2EE Container (tomcat, Jboss, Ant,...) parallel betrieben. Der Administrationsaufwand ist dafür allerdings "oversized", dann für genau diese Anwendungsfälle sind parallel Betriebene Solr Cores geschaffen.

Mittwoch, 22. Juni 2011

schema.xml

Die schema.xml liegt üblicher Weise im conf Verzeichnis einer jeden SOLR Instanz und dient zur Konfiguration des Lucene Index: wie werden Daten im Index gehalten und in wie weit werden sie noch bearbeitet (Stemming/Wortstammbildung, Stoppworte, etc)

Im ersten Moment wirkt diese Datei unübersichtlich und erschlagend. Tatsächlich ist sie aber nur voll gepackt mit Beispielen, die im konkreten Fall oftmals unnötig sind.

Die schema.xml kann man grob in 3 Bereiche unterteilen:

Donnerstag, 16. Juni 2011

Faceted Search / Analyse der Daten im Volltext

Facetted search ist ein sehr mächtiges und nützliches Feature.
Dabei werden Suchen ggf. nur auf Teilbereiche angewandt und Ergebnisse gruppiert.

1.) Beispiel: Personalverwaltungssystem

HowTo & Tutorial:
Suchen mit PHP/Solr in Lucene

Seiten

Vorwort: wieso ein Blog zu PHP, Solr und Lucene?

Mittwoch, 13. Juli 2011

Mehere Solr Instanzen parallel betreiben (solr.xml)

Mittwoch, 22. Juni 2011

schema.xml

Donnerstag, 16. Juni 2011

Faceted Search / Analyse der Daten im Volltext