Diskussion:Text Mining
Referenz 3 ist down und scheinbar noch ein paar andere. (nicht signierter Beitrag von 217.50.239.151 (Diskussion) 11:36, 10. Aug. 2011 (CEST))
Eine Anmerkung an die Allgemeinheit zu einem Satz im ersten Abschnitt.
>Textmining-Systeme liefern im Optimalfall Informationen, >von denen Benutzer bisher nicht wussten, dass sie sie nicht kannten.
Klingt für mich etwas unglücklich formuliert.
Heißt das, der Benutzer weiß nicht, daß er nicht weiß? Oder glaubt der Benutzer zu wissen, obwohl er es nicht weiß? Für mich klingt das so "Ich weiß nicht, daß ich es nicht weiß, also weiß ich entweder nichts davon oder ich glaube zu wissen" Oder wie seht ihr das? (nicht signierter Beitrag von 195.14.249.83 (Diskussion) 09:01, 25. Jul. 2007)
Finde ich eigentlich nicht; im Optimalfall liefern Sie Zusammenhänge von denen man nicht annehmen konnte dass es sie gab. Typisches Beispiel Warenkorbanalysen, die Zusammenhänge zwischen Babywindeln und Bier ergaben. Herausgestellt hat sich dass junge Väter sich mit Bier belohnen wenn sie Windeln kaufen.
--> Weblinks <-- Ich finde Wissensexploration.de liefert auf Deutsch die umfassendsten Informationen zum Thema Text-Mining. Zudem auch sehr verständlich aus informationswissenschaftlicher Sicht geschrieben. Wieso wird der Link herausgenommen? Den Verweis auf eines der vielen (im weiteren Sinn) statistischen Softwarekits finde ich allerdings unpassend. (nicht signierter Beitrag von Maglucutus (Diskussion | Beiträge) 00:43, 9. Aug. 2008)
Redundante Quellenangaben
[Quelltext bearbeiten]Die Quellenangaben sind ja total unlesbar... es wäre gut, wenn sie ohne Seitenangaben zusammengefasst werden könnten, das würde das doch erheblich übersichtlicher machen, oder? --Chire 14:18, 10. Aug. 2011 (CEST)
- Warum? Damit es schwieriger nachvollziehbar wird, wo das in der Quelle steht? fossa net ?! 21:37, 10. Aug. 2011 (CEST)
- fossa hat Recht - so wird richtig bequellt. Eine Kürzung mittels "ebenda" oder "ebd." ist nach WP Konventionen nicht erwünscht. --Jesus Presley (Diskussion) 14:25, 4. Aug. 2012 (CEST)
Lemma
[Quelltext bearbeiten]Das Lemma solle eigentlich auf Deutsch Text-Mining oder Textmining lauten. Textmining gefällt mir ganz gut.--Boshomi 22:23, 8. Nov. 2011 (CET)
- Text-Mining wäre analog zu Data-Mining, hätte insofern eine Berechtigung. Eine Begründung findet sich im Abschnitt Deutscher Begriff, eine interessante Diskussion dazu gibt es auch. Der Duden empfielt die Schreibweise Data-Mining. Ich würde also für Text-Mining plädieren. --Jesus Presley (Diskussion) 14:41, 4. Aug. 2012 (CEST)
- Ich wundere mich, dass damals bei der Verschiebung von Data-Mining nicht auch gleich an Text-Mining gedacht wurde. Ich glaube, die Argumente sprechen für Text-Mining. --Zahnradzacken (Diskussion) 21:41, 6. Aug. 2012 (CEST)
- steht auf Benutzer:Boshomi/Arbeitsliste#Streitfälle Dieser Fall ist laut der Rechtschreibregeln eindeutig. Die derzeitige Schreibweise ist ein klarer Fall von Deppenleerzeichen. Richtig ist Laut §37 Rechtschreibregeln Textmining, die Variante Text-Mining ist nach §45 möglich, da aber in diesem Fall die Aussprache im Gegensatz zu Data-Mining selbst für den Fachunkundigsten klar erkennbar ist, ist hier erstere Variante ohne Bindestrich zu bevorzugen. Ausreichend viele Treffer für die korrekte Schreibweise sollten jedenfalls in der Literatur vorhanden sein. In der Phase der Verwirrung vor der Einführung der Rechtschreibreform ist das Deppenleerzeichen zeitweise als korrekt durchgegangen, diese Zeiten sind nun vorbei. Das Fraunhofer-Institut verwendet jedenfalls Textmining. (Übrigens vor kurzem hatten wir noch Help Desk als Lemma) Frohes Schaffen, Boshomi – rede mit mir – 22:03, 6. Aug. 2012 (CEST)
- Ich wundere mich, dass damals bei der Verschiebung von Data-Mining nicht auch gleich an Text-Mining gedacht wurde. Ich glaube, die Argumente sprechen für Text-Mining. --Zahnradzacken (Diskussion) 21:41, 6. Aug. 2012 (CEST)
Lustig, dass die Weiterleitung unter „Text-Mining“ 2009 als „unerwünscht“ gelöscht wurde. --Kurt Jansson (Diskussion) 11:56, 16. Mai 2015 (CEST)
Erweiterungen existierender Softwaresuiten
[Quelltext bearbeiten]Wäre hier nicht besser und lesbarer: "Erweiterungen existierender Software" oder gar "Erweiterungen existierender Anwendungen" ? --Jesus Presley (Diskussion) 14:43, 4. Aug. 2012 (CEST)
Wordcruncher
[Quelltext bearbeiten]... finde ich in der dt. WP nicht. Und auch nicht in der englischsprachigen.
"WordCruncher is a text retrieval and analysis program that allows users to index or use a text, including very large multilingual Unicode documents. It supports the addition of tags (such as part of speech, definitions, lemma, etc), graphics, and hyperlinks to text or multimedia files. In addition to supporting contextual and tag searching, WordCruncher also includes many analytical reports, including collocation, vocabulary dispersion, frequency distribution, vocabulary usage, and various other reports."
Wer kennt sich aus und könnte den Artikel anlegen? --Delabarquera (Diskussion) 09:42, 7. Mär. 2013 (CET)