Direkt zum Inhalt
Bild
Untitled%20design%20%283%29.jpg

Federierte Suche mit Drupal und Apache Solr durchführen

AI-Translated
article publisher

Jayati

Drupal

Das Internet ist ein unendlicher Pool an Inhalten, und Ihr Unternehmen möchte nur die nützlichsten und relevantesten Informationen daraus ziehen. 

Mit künstlicher Intelligenz (KI) erwarten Benutzer den Zugriff auf eine zentrale Bibliothek, in der die Suchfunktion eine der wichtigsten Implementierungen auf der Website ist. Dennoch gelingt es uns oft nicht, die benötigten Informationen über viele Suchmaschinen zu erhalten, selbst über die besten Suchanwendungen. Diese Fehler können technische, kulturelle und vielleicht auch persönliche Gründe haben. Eine Standard-Inhaltssuche dauert oft zu lange, wenn keine Optimierungspraktiken angewendet werden, was wiederum die Besucher aufgrund der Wartezeit irritiert. Die Vergeblichkeit der Zeit in diesem Prozess ist das größte Versagen, das zu enormen Kosten für das Unternehmen führt. Was wir brauchen, ist ein Tool, mit dem wir mehrere durchsuchbare Ressourcen durchsuchen können.

Eine grafische Darstellung der ‚Hohen Kosten, wenn Informationen nicht gefunden werden‘
Quelle: International Data Corporation

Unter Dutzenden von geeigneten Tools auf dem Markt können nur wenige die Qualität liefern, die die oben genannten Statistiken reduzieren kann, die besagen, dass ein Unternehmen 48.000 Dollar pro Woche verschwendet, weil es nicht in der Lage ist, Informationen zu finden und abzurufen, wenn 35-50 % der innerhalb eines Unternehmens verfügbaren Informationen nicht zentral indiziert sind. Lassen Sie uns die Optionen erkunden.

Federated Search entmystifiziert

In der dringenden Notwendigkeit eines hochverfügbaren und skalierbaren Suchdienstes stellen wir Federated Search vor. Eine Anwendung, mit der Sie mehrere Sites (einschließlich Drupal) in einer einzigen Suchanwendung indizieren und konsistente Ergebnisse erhalten können. Sie besteht aus drei Hauptteilen:

  • Inhaltsindizierung über Drupal-Integration (bereitgestellt)
  • Ergebnisbereitstellung über React-Anwendung (bereitgestellt)
  • Datenspeicherung in einem Solr-Backend (erforderlich)

Wenn Drupal, Solr und React zusammenkommen, ermöglichen sie die Indizierung von Daten aus beliebigen Quellen, standardisieren sie und präsentieren sie auf einfache Weise. Dies führt zu Flexibilität für Site-Administratoren und zu einer besseren Erfahrung für die Benutzer. Hier ist ein Beispiel:

Innerhalb eines traditionellen Suchsystems (Abb. 1; Diagramm unten) zeigt die Suchanfrage des Benutzers nur begrenzte Informationen von einer einzelnen Site. Mit einer Federated Search (Abb. 2) erhöht sich die Skalierbarkeit durch die Nutzung eines bestehenden Index. Alle Abfragen werden an eine Teilmenge von Sammlungen übermittelt, so dass jede Remote-Anwendung die Abfrage gegen ihr eigenes Dokumenten-Repository durchführen kann. Das Endergebnis wird in einer Sammlung zurückgegeben und zu einer einzigen integrierten Liste zusammengeführt.

Warum Federated Search?

Die Suche ist eine geschäftskritische Funktion, die zur Navigation auf der Plattform von Sites eines Unternehmens verwendet wird, und die Federated-Search-Technologie bietet die Schnittstelle für verschiedene Informationsressourcen, die vielfältige Vorteile bietet, darunter: 

Effizienz

Zeit ist wichtig, und eine Federated Search Engine ermöglicht es den Benutzern, einen großen Teil davon zu sparen, indem sie mehrere Suchen im Namen des Benutzers durchführt. Sie ist darauf spezialisiert, die Inhalte aus verschiedenen Quellen zu finden und sie auf einer einzigen Ergebnisseite zusammenzuführen. 

Qualität der Ergebnisse

Die Qualität des Ergebnisses ist ein wichtiger Faktor für den Erfolg der Federated Search. Der Algorithmus der Engines arbeitet so, dass er die Qualität der Ausgabe verbessert und gleichzeitig zahlreiche Quellen abdeckt. 

Aktuelle Inhalte

Die Federated Search Engines zeigen Inhalte in Echtzeit an. Die sich häufig ändernden Daten werden in der Federated Search aktualisiert, da es für die Forschenden, für die aktuelle Inhalte entscheidend sind, einfacher wird, Echtzeitdaten zu finden. Wenn die Content-Eigentümer ihre Quelle aktualisieren, wird dies dem Forschenden bei der nächsten Abfrage angezeigt. 

Dynamische, vielfältige und ansprechende Informationen

Die Inhalte aus verschiedenen Quellen wie Katalogen, Websites und Bibliotheken werden von der Federated Search Engine auf einer einzigen und integrierten Seite zusammengetragen, die vollständige Informationen über die vom Forschenden generierte Abfrage liefert. 

Kundenbindung

Durch die Möglichkeit, Suchergebnisse von mehreren durchsuchbaren Content-Anbietern gleichzeitig über eine Suchabfrage zu liefern, bindet Federated Search Kunden, die regelmäßig Zeit sparen und qualitativ hochwertige Ergebnisse in Echtzeit erhalten müssen. 

Hände einer Frau, die an einem Laptop arbeitet


Enterprise Search vs. Federated Search

Die beiden Begriffe, Enterprise Search und Federated Search, werden von einigen Anbietern synonym verwendet, was zu Verwirrung führen kann. Sie unterscheiden sich jedoch erheblich in einer Umgebung, in der Unternehmen mehrere Suchprodukte einsetzen oder verschiedene Informationsmanagementsysteme integrieren, die ihre eigenen Suchfunktionen einbetten können. 

 

Enterprise Search

Federated Search

Content-Quelle

Inhalte werden lokal indiziert und in einer Datenbank gespeichert.

Nutzt die von einem externen System bereitgestellten Suchergebnisse

Indizierung

Dokumente sind über den Indexer verfügbar

Verlässt sich auf die Indizierungsfunktionen des externen Systems

Zugriff

Um lokal auf Dokumente zuzugreifen und sie zu indizieren, muss das Dokument an einen lokal zugänglichen Ort geladen werden

Der Indizierungsprozess wird vom Remote-System verwaltet. Dazu gehört auch die regelmäßige Indizierung, um den Index auf dem neuesten Stand zu halten

Durchführung einer Federated Search

OpenSense Labs initiierte eine Federated Search über Apache Solr und Drupal für drei verschiedene Sites. Hier ist eine schrittweise Erklärung, wie die Suche durchgeführt werden kann: 

Der Crawler erfasst Daten von Site 1, Site 2 und Site 3. 

Die ausgewählten Daten werden durch die Middle-Ware (ein PHP-Framework) geleitet, wo sie identifiziert, gefiltert und kategorisiert werden. 

Als Nächstes fungiert die Open-Source-Plattform (Sie können entweder Apache Solr oder ElasticSearch wählen) als Look-up-Service-Provider, um die Daten in einem einzigen Seitenergebnis für den Benutzer im CMS zu indizieren.

Das Js-Skript wird auf den Server angewendet, um Daten verschiedener Sprachen (Python, PHP oder andere) zu konvertieren und einheitlich darzustellen. 

Architektur der Federated Search

Apache Solr 

„Apache Solr ist ein unternehmenstaugliches, schnelles und hochskalierbares Tool, mit dem anspruchsvolle Anwendungen erstellt werden können, um eine hohe Leistung zu erzielen.“

Apache Solr ist eine unternehmenstaugliche, schnelle und hochskalierbare Open-Source-Suchplattform, die eine ausgefeilte Anwendung erstellt, um eine hohe Leistung zu erzielen und verteilte Indizierung, Replikation und Load-Balanced Querying mit einer zentralisierten Konfiguration zu ermöglichen. Durch die Verwendung der mit der Search API gelieferten Solr-Konfiguration ermöglicht Solr ein besseres Verständnis von Drupal, seinen Feldtypen und den darin enthaltenen Daten.

ElasticSearch

Offizielles Logo von ElasticSearch mit einem mehrfarbigen Symbol auf der linken Seite und dem Wort ‚Elastic‘ auf der rechten Seite
„Elasticsearch ist unglaublich schnell und kann bei der Integration mit Drupal zusätzliche Vorteile bieten.“

Elasticsearch ist eine gleichwertige Alternative zu Apache Solr und verfügt über eine einfache RESTful-API. Es ist unglaublich schnell und kann bei der Integration mit Drupal zusätzliche Vorteile bieten. 

Die Übertragung von Daten von Drupal zu Elasticsearch ermöglicht es der Search API, die volle Kontrolle über den Index über die Backend-Schnittstelle zu haben. Der erste Schritt ist also die Entscheidung für das Search API-Modul. 

Fazit

Angesichts der Fülle an Daten, die täglich im Web hinzugefügt werden, wird dies von hier an nur noch zunehmen. Was Forschende jetzt mehr denn je brauchen, ist ein Tool zum Suchen und Analysieren von Daten in Echtzeit, wie Apache Solr oder Elasticsearch, da beide skalierbare und hochverfügbare Architekturen auf Cloud-Hosting-Infrastrukturen unterstützen.

Wir von OpenSense Labs verstehen die Bedürfnisse Ihres Unternehmens und bieten verschiedene Dienstleistungen für unsere Kunden an. Nehmen Sie Kontakt auf unter [email protected]

Abonnieren

Ready to start your digital transformation journey with us?

Verwandte Blogs

Zurück von der DrupalCon Atlanta 2025: Ein Meilenstein für OpenSense Labs

Zurück von der DrupalCon Atlanta 2025: Ein Meilenstein für OpenSense Labs

„Fit. Schnell. Für die Ewigkeit gebaut.“ Das war nicht nur ein Slogan, sondern die Denkweise, mit der wir zur DrupalCon…

Erklärbare KI-Tools: SHAPs Stärke in der KI

Explainable AI tools Explainable AI And SHAP OpenSense Labs

Wissen Sie, was erklärbare KI-Tools sind? Erklärbare KI-Tools sind Programme, die zeigen, wie eine KI ihre Entscheidungen…

KI-Chatbots: Präzision und Persönlichkeit in Perfektion

Creating AI Chatbot OpenSense Labs

In der Welt der künstlichen Intelligenz ist die Entwicklung eines KI-Chatbots, der nicht nur akkurate Informationen liefert…