Skip to main content

Information Retrieval

Information Retrieval bedeutet Informationsrückgewinnung und geschieht durch das Auswerten unstrukturierter Daten. Suchmaschinen im Internet gehen so vor. Prinzipiell existiert eine sehr große Datenmenge, aus welcher der Nutzer Informationen einer bestimmten Art – klassifiziert durch einen Suchbegriff – herausfiltern möchte. Die Suchmaschine hat zwei Aufgaben: die Datenmenge nach dem Stichwort zu durchsuchen und die gefundene Information dahin gehend zu bewerten, ob sie bedeutsam genug für die Suche ist. Der Vorgang heißt Informationsrückgewinnung, weil er rückwärts von der großen Datenmenge zu den einzelnen Ergebnissen in der Sortierung nach Relevanz führt. Diese Reihenfolge kann nicht perfekt sein, lässt sich aber durch eine erweiterte Suche zum Beispiel durch mehrere Suchbegriffe verbessern.

Information Retrieval: Anwendung und Modelle

Die Anwendung findet in den großen, öffentlichen Suchmaschinen ebenso wie in Wissensdatenbanken beispielsweise von Fachbibliotheken statt. Das Ergebnis kann mehr oder weniger relevant sein, es gibt auch sogenannte False Drops, also überflüssige Ergebnisse. Zu den eingesetzten Modellen beziehungsweise Algorithmen zählen die boolsche Algebra (Einsatz von Operatoren wie “und” / “nicht” / “oder”), das Vektorraum Modell unter Berücksichtigung von Rankingfaktoren und auch das probabilistische Modell, das von Wahrscheinlichkeitswerten bezüglich der Relevanz eines Dokumentes ausgeht.

Sie haben noch Fragen?

Kontaktieren Sie uns

Information Retrieval
Beitrag bewerten