Diskussion:Phonetische Suche
Ich halte Google für ein schlechtes Beispiel: Die "Meinten sie..."-Hinweise benutzen soweit ich weiss eine Tippfehlerkorrektur, die auf der Basis von Buchstaben arbeitet und sich um Laute nicht kümmert. Phonetische suche wäre dort auch kaum möglich, weil dazu die Sprache der Suchanfrage bekannt sein müsste (die Sprachabhängigkeit sollte evtl im Artikel noch erwähnt werden). Der Unterschied zwischen einer Tippfehlerkorrektur (Pattern Matching) und der phonetischen Suche sollte wohl noch herausgearbeitet werden.
Ach ja, noch was: mir fehlt ganz oben noch ein Satz mit "Phonetische Suche ist...", und Beispiele gehören IMHO nach hinten... vielleicht mach ich das noch. Aber erstaml sollten wir klären, was jetzt mit Google ist... -- D. Dÿsentrieb ⇌ 19:54, 5. Jan 2005 (CET)
- Das ist eine schwierige Frage mit Google. Prinzipiell dachte ich bisher auch, dass Google nur Pattern Matching betreibt. Allerdings verwundet mich, dass die sich selbst Phonetische Suchhexe nennende Suchmaschine witch bei dem Begriff nuw jork nichts findet, während google New York vorschlägt. Auch foneetick liefert bei Google Phonetik und da glaub ich nicht mehr an Pattern Matching, weil es keine mehr als drei Buchstaben übereinstimmenden Teilstrings mehr gibt. Nun haben ich den heuristischen Beweis ;-), denn Änzeeklobedie liefert Enzyklopädie, während Änzäglobedi den engl. Begriff Encyclopedia liefert. Da ist nach meiner Sicht der Dinge, nichts mehr drin mit Pattern Matching. Nun denn, es bleibt alles Heuristik. Wie findet man das denn raus, was Google anwendet.
- Die Notwendigkeit eines einleitenden ersten Satzes, sehe ich übrigens genauso. --Friese 21:51, 5. Jan 2005 (CET)
- Einen Bearbeitungskonflikt hat es gegeben. Ich hefte schnell an, was ich Duesentrieb antworten wollte und lese mir dann durch, was Friese geschrieben hat.
- Ich glaube auch, dass dieser Text nicht der Weisheit letzter Schluss sein kann. Für mich gibt es diese Fragen: Sehen Algorithmen für Rechtschreibkorrekturen und Algorithmen für phonetische Suche tatsächlich grundsätzlich immer vollkommen unterschiedlich aus? In welchem Maße fließen bei den Vorschlägen, die die Programme anbieten, statistische Auswertungen über die Häufigkeit von Schreibungen mit hinein? Ich melde mich, wenn ich zu neuen Erkenntnissen kommen sollte. -- Kerbel 21:56, 5. Jan 2005 (CET)
- Soweit ich weiss sind die algorithmen ähnlich, nur wird bei der phnetischen suche zunächst von Buchstaben in Laute umgewandelt und dann verglichen. Aber ich bin wie gesagt kein Experte, hab' na nur oberflächlich Ahnung - und so würde ich es programmieren ;) -- D. Dÿsentrieb ⇌ 23:44, 5. Jan 2005 (CET)
- Wegen google: naja, es gibt noch andere algorithmen als sequence-alignment, z.B. die Lewenstein-Distanz, die auch nichts mit Lauten am hut at ("nuw jork" -> "new york" hat z.B. Lewenstein-Distanz 2, was meistens noch als OK gilt). Aber es ist gut möglich, dass Google mit Heuristiken arbeitet die die Sprache bestimmen, oder mit Tabellen üblicher Flaschschreibungen, oder, oder.... Ich würde das jedenfalls nicht so als "definitives Beispiel" bringen. -- D. Dÿsentrieb ⇌ 23:44, 5. Jan 2005 (CET)
Sibylle schrieb: Ich glaube bei Google wird kein echter phonetischer Abgleich durchgeführt. Denn wenn ich "inaff" oder "inuff" eingebe, wird mir nicht "enough" geliefert, und bei "Gugel" kommt nicht der Alternativvorschlag "Google".
Schreibungen oder Schreibweisen?
[Quelltext bearbeiten]Ist Schreibungen der richtige Ausduruck?
- http://www.dwds.de/?woerterbuch=1&corpus=1&kompakt=1&qu=Schreibung
Kerbel 10:17, 17. Sep 2005 (CEST)
TRAPHO
[Quelltext bearbeiten]Ich bin zwar auch der Meinung, dass kommerzielle Anbieter hier eigentlich nicht benannt werden sollten, doch finde ich es immer wieder erschreckend, welch banale, zumeist orthographisch-basierte Verfahren als zu phonetischer Suche gehörig bezeichnet werden. Keines dieser Verfahren berücksichtigt tatsächliche phonologische (nicht phonetische, sic!) Eigenschaften der jeweiligen Sprache. Das m.W. einzig verfügbare Produkt, das auf einer tatsächlichen Analyse phonologischer Eigenschaften einer Sprache beruht, ist TRAPHO. Daneben gibt es natürlich noch eine Vielzahl wissenschaftlicher Ansätze, die an Instituten/Lehrstühlen für Phonetik und Phonologie entwickelt werden, doch bislang kaum umfangreicheren Einsatz gefunden haben. Die genannten Verfahren (Soundex, Levenshtein, Pattern-Matching, Fuzzy Search etc.) haben ja vor allem Informatiker entwickelt, seltenst Sprachwissenschaftler. n.n. 9. Okt. 2009 (13:38, 9. Okt. 2009 (CEST), Datum/Uhrzeit nachträglich eingefügt, siehe Hilfe:Signatur)