Diskussion:String-Matching-Algorithmus
Deutsche Begrifflichkeiten
[Quelltext bearbeiten]Kann man den Artikeltitel eventuell verdeutschen? Bitte um Vorschläge. -- Schewek 23:38, 18. Nov 2003 (CET)
hm, schwierig -- es gibt so gut wie keine deutschen Begriffe für String Matching, jeder, der sich damit beschäftigt, wird über die englischen Begriffe stolpern (und würde in der Wikipedia denn auch nach denen suchen) --Pinguin.tk 14:49, 29. Apr 2004 (CEST)
- Wie wäre es mit Textmustererkennung oder Textmustersuche? Man kann ja unter den englischen/denglischen Begriffen entsprechende Verweise einrichten. Mh 11:20, 7. Feb 2006 (CET)
Problemstellung
[Quelltext bearbeiten]Sollte bei Problemstellung, Punkt 1. "Die Suchmaske ist vorgegeben, und dann sollen beliebige Texte durchsucht werden." auch Bezug auf die spezielle Problematik bei Datenbankfeldern (Tabellenzellen) genommen werden? Bei Datenbankfeldern kommt als zusätzliches Unterscheidungskriterium hinzu, ob sich Feldlängen unterscheiden oder nicht: Der Vergleich der Zeichenketten "FRANK " (Datenbankfeld der Länge 10) und "FRANK" als Suchmaske könnte als Ergebnis "gefunden" erwarten lassen. Dies ist aber bei den meisten Datenbanken nicht der Fall, insbesondere, wenn die Suchmaske selbst Inhalt eines Datenbankfeldes von anderer Länge als 10 ist.
Vorsicht Halbwissen (Überarbeiten)
[Quelltext bearbeiten]Ich habe gerade den Artikel gelesen und stelle hohe qualitative Mängel fest.
- Die Voraussetzungen müssen sauber nieder geschrieben werden. Werden feststehende Zeichenketten gesucht oder sind reguläre Ausdrücke möglich.
- Beispiel ist erforderlich.
- Verweis auf Implementierungen wie grep fehlt.
- Vorsicht bei Suchmaschinen. Google oder http://htdig.org/ durchsuchen die Texte nicht zur Laufzeit, sondern legen vorher Indizes auf Wortbasis an. Wie das bei Wikipedia ist weiß ich nicht. Deshalb können sie niemals allgemeine reguläre Ausdrücke suchen, sondern allenfalls reguläre Ausdrücke innerhalb eines Wortes.
Ich setze mal ein Überarbeiten rein und schlage vor gleich in der Einleitung zu schreiben um was es geht und um was nicht. --Suricata 13:06, 16. Dez 2005 (CET)
Ergänzung: reguläre Ausdrücke und ungefähre Suche sollten explizit ausgenommen werden, da die später genannten Algorithmen genau das nämlich nicht können, sondern allenfalls über Umwege. --Suricata 13:13, 16. Dez 2005 (CET)
Eumel
[Quelltext bearbeiten]Was bedeuten diese merkwürdigen Eumel in der Übersichtstabelle bei den Zeitangaben (die aussehen wie O)?
- Eumel? Das sind Landau-Symbole. R. Buchholz 19:09, 22. Mai 2006 (CEST)
Worst-Case von Boyer-Moore
[Quelltext bearbeiten]liegt der worst-case von Boyer-Moore nicht eigentlich bei O(n*m) statt bei O(n) (nicht signierter Beitrag von 88.64.137.1 (Diskussion | Beiträge) 09:15, 14. Feb. 2010 (CET))