MySQL: Was ist die 50-Prozent-Marke?
Frage von Sledge | 13.03.2012 um 17:38
Im Zusammenhang mit der Volltextsuche von MySQL habe ich nun schon des öfteren gehört, dass eine sogenannte 50 Prozent Marke angewendet wird. Das Problem ist dabei allerdings, dass dies immer nur erwähnt aber nie erklärt wird.
Kann mir jemand diese 50 Prozent Marke erklären?
Ähnliche Themen
MySQL: Zeilenumbrüche in MySQL
Tipp | 0 Kommentare
Unternehmen aus Bayern im DAX, MDAX, SDAX und TecDAX
Info | 0 Kommentare
MySQL: Minimale Wortlänge bei der Volltextsuche ändern
Tipp | 1 Kommentar
MySQL: CSV Export als auf dem Server gespeicherte Datei
Tutorial | 0 Kommentare
MySQL: CSV Export als automatischer Download
Tutorial | 1 Kommentar
MySQL: Reguläre Ausdrücke in MySQL-Abfragen
Info | 0 Kommentare
Wie alt werden Frösche? Eine Bilanz des Todes.
Info | 1 Kommentar
Wichtiger Hinweis
Bitte beachten Sie: Die Beiträge auf askingbox.de sind Beiträge von Nutzern und sollen keine professionelle Beratung ersetzen. Sie werden nicht von Unabhängigen geprüft und spiegeln nicht zwingend die Meinung von askingbox.de wieder. Mehr erfahren.
Jetzt mitmachen
Stellen Sie Ihre eigene Frage oder schreiben Sie Ihren eigenen Artikel auf askingbox.de. So gehts.
Die 50 Prozent Marke bei der MySQL Volltextsuche soll zu besseren Ergebnissen führen. Sie besagt, dass alle Wörter aus der Suche ausgeschlossen werden, die mindestens in 50 Prozent der Datensätze vorkommen.
Der Gedanke dahinter ist folgender: Suchen wir zum Beispiel nach Worten wie "einer" oder "haben", die fast in jedem Text vorkommen, wird dadurch das Suchergebnis nicht nennenswert verbessert, eher im Gegenteil - es müssten eigentlich fast alle Datensätze zurückgegeben werden.
Daher konzentriert sich MySQL hier auf die bedeutsamen Worte, die die Suchergebnisse voneinander auch wirklich unterscheiden.
Problematisch ist dies natürlich in dem Fall, wenn wir nur sehr wenige Datensätze haben und daher einige auch relevante Worte (durch Zufall) in allen verfügbaren Datensätzen vorkommen. Deswegen macht die MySQL Volltextsuche eigentlich nur bei einer großen Menge von Datensätzen einen Sinn.
Wollen wir die 50 Prozent Marke umgehen, können wir auch die Volltextsuche von MySQL "IN BOOLEAN MODE" verwenden. Hier findet die 50 Prozent Marke keine Anwendung und wir können auch noch genauer bestimmen, welche Worte vorkommen sollen und dürfen und welche nicht.
13.03.2012 um 22:36