00 Stimmen

MySQL: Was ist die 50-Prozent-Marke?

Frage von Sledge | 13.03.2012 um 17:38

Im Zusammenhang mit der Volltextsuche von MySQL habe ich nun schon des öfteren gehört, dass eine sogenannte 50 Prozent Marke angewendet wird. Das Problem ist dabei allerdings, dass dies immer nur erwähnt aber nie erklärt wird.

Kann mir jemand diese 50 Prozent Marke erklären?

AntwortenPositivNegativ
1Beste Antwort1 Stimme

Die 50 Prozent Marke bei der MySQL Volltextsuche soll zu besseren Ergebnissen führen. Sie besagt, dass alle Wörter aus der Suche ausgeschlossen werden, die mindestens in 50 Prozent der Datensätze vorkommen.

Der Gedanke dahinter ist folgender: Suchen wir zum Beispiel nach Worten wie "einer" oder "haben", die fast in jedem Text vorkommen, wird dadurch das Suchergebnis nicht nennenswert verbessert, eher im Gegenteil - es müssten eigentlich fast alle Datensätze zurückgegeben werden.

Daher konzentriert sich MySQL hier auf die bedeutsamen Worte, die die Suchergebnisse voneinander auch wirklich unterscheiden.

Problematisch ist dies natürlich in dem Fall, wenn wir nur sehr wenige Datensätze haben und daher einige auch relevante Worte (durch Zufall) in allen verfügbaren Datensätzen vorkommen. Deswegen macht die MySQL Volltextsuche eigentlich nur bei einer großen Menge von Datensätzen einen Sinn.

Wollen wir die 50 Prozent Marke umgehen, können wir auch die Volltextsuche von MySQL "IN BOOLEAN MODE" verwenden. Hier findet die 50 Prozent Marke keine Anwendung und wir können auch noch genauer bestimmen, welche Worte vorkommen sollen und dürfen und welche nicht.
13.03.2012 um 22:36

AntwortenPositiv Negativ
Antworten

Ähnliche Themen

Wichtiger Hinweis

Bitte beachten Sie: Die Beiträge auf askingbox.de sind Beiträge von Nutzern und sollen keine professionelle Beratung ersetzen. Sie werden nicht von Unabhängigen geprüft und spiegeln nicht zwingend die Meinung von askingbox.de wieder. Mehr erfahren.

Jetzt mitmachen

Stellen Sie Ihre eigene Frage oder schreiben Sie Ihren eigenen Artikel auf askingbox.de. So gehts.