Liste der häufigsten Wörter der deutschen Sprache

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Worthäufigkeitsstatistik)
Zur Navigation springen Zur Suche springen

Die Liste der häufigsten Wörter der deutschen Sprache beruht auf statistischen Auswertungen von Publikationen in deutscher Sprache.

Eine im Kaedings Häufigkeitswörterbuch 1897 publizierte Auszählung von rund elf Millionen Wörtern ergab, dass nur 207 Wortformen nach ihrer Häufigkeit (Okkurrenz) über 50 Prozent der deutschen Schriftsprache ausmachen.[1] Eine solche Liste ist vor allem für die Linguistik, Kryptoanalyse und Textkompression interessant. Es sei darauf hingewiesen, dass hier die Häufigkeit von Wörtern (grammatisches Wort: Wortform) und nicht von Worten (semantisches Wort: Wortparadigma oder Lemma) ermittelt wurde und ein Rückschluss auf die Größe des Wortschatzes daher nur begrenzt möglich ist. Eine die Verteilung von Worthäufigkeiten beschreibende Gleichung hatte 1928 E. V. Condon[2] aufgestellt.

Die 207 häufigsten Wortformen im Deutschen (1897, Häufigkeitswörterbuch von F. W. Kaeding)

[Bearbeiten | Quelltext bearbeiten]
30 Formen stellen 31,8 % der Wörter
die, der, und, in, zu, den, das, nicht, von, sie,
ist, des, sich, mit, dem, dass, er, es, ein, ich,
auf, so, eine, auch, als, an, nach, wie, im, für

Diese Formen (mit Ausnahme der Form eine) sind wie nach dem Zipf’schen Gesetz zu erwarten einsilbig und höchstens fünf Buchstaben lang. Als Wortklassen sind vorwiegend Partikeln, insbesondere Konjunktionen und Präpositionen, sowie Personalpronomen und Artikel vertreten, beispielsweise alle einsilbigen Formen des bestimmten Artikels. Als einziges Verb taucht sein in der 3. Person Singular Präsens Indikativ (ist) auf. Die einzige Wortform in dieser Liste, die durch die Rechtschreibreform von 1996 beeinflusst wurde, ist dass.

Weitere 70 Formen stellen nochmals 15,3 % der Wörter
man, aber, aus, durch, wenn, nur, war, noch, werden, bei,
hat, wir, was, wird, sein, einen, welche, sind, oder, zur,
um, haben, einer, mir, über, ihm, diese, einem, ihr, uns,
da, zum, kann, doch, vor, dieser, mich, ihn, du, hatte,
seine, mehr, am, denn, nun, unter, sehr, selbst, schon, hier,
bis, habe, ihre, dann, ihnen, seiner, alle, wieder, meine, Zeit,
gegen, vom, ganz, einzelnen, wo, muss, ohne, eines, können, sei

Das häufigste Substantiv ist nach dieser Zählung Zeit, allerdings wird bei der Zählung allgemein nicht zwischen Groß- und Kleinschreibung unterschieden, was das Ergebnis verfälschen kann. Als weiterer Verbalstamm zeigt sich haben in verschiedenen Formen.

Weitere 107 Formen stellen dann 7,25 % der Wörter
ja, wurde, jetzt, immer, seinen, wohl, dieses, ihren, würde, diesen,
sondern, weil, welcher, nichts, diesem, alles, waren, will, Herr, viel,
mein, also, soll, worden, lassen, dies, machen, ihrer, weiter, Leben,
recht, etwas, keine, seinem, ob, dir, allen, großen, Jahre, Weise,
müssen, welches, wäre, erst, einmal, Mann, hätte, zwei, dich, allein,
Herren, während, Paragraph, anders, Liebe, kein, damit, gar, Hand, Herrn,
euch, sollte, konnte, ersten, deren, zwischen, wollen, denen, dessen, sagen,
bin, Menschen, gut, darauf, wurden, weiß, gewesen, Seite, bald, weit,
große, solche, hatten, eben, andern, beiden, macht, sehen, ganze, anderen,
lange, wer, ihrem, zwar, gemacht, dort, kommen, Welt, heute, Frau,
werde, derselben, ganzen, deutschen, lässt, vielleicht, meiner

Als erstes Vollverb erscheint sagen in der Liste, während wissen nicht vom Farbnamen in weiß getrennt gezählt ist. Die Okkurrenz von Paragraph deutet auf ein Textkorpus hin, das zu einem signifikanten Teil aus juristischen Texten besteht.

Die hundert häufigsten Wörter im Deutschen

[Bearbeiten | Quelltext bearbeiten]

Diese Liste der Universität Leipzig (2001, Uni Leipzig, Deutschland-Korpus[3]) stammt aus dem Jahr 2001 und enthält deshalb und auch weil das Korpus aus Deutschland ist, noch das Wort Mark, das zudem weiterbestehende Bedeutungen hat.[4] Die gesprochene Sprache ist nicht berücksichtigt. Manche Wortformen wie Artikel tauchen doppelt auf, da die Großschreibung (am Satzanfang) berücksichtigt wird.

Platz 1–10
Platz Wort
1 der
2 die
3 und
4 in
5 den
6 von
7 zu
8 das
9 mit
10 sich
Platz 11–20
Platz Wort
11 des
12 auf
13 für
14 ist
15 im
16 dem
17 nicht
18 ein
19 Die
20 eine
Platz 21–30
Platz Wort
21 als
22 auch
23 es
24 an
25 werden
26 aus
27 er
28 hat
29 dass
30 sie
Platz 31–40
Platz Wort
31 nach
32 wird
33 bei
34 einer
35 Der
36 um
37 am
38 sind
39 noch
40 wie
Platz 41–50
Platz Wort
41 einem
42 über
43 einen
44 Das
45 so
46 Sie
47 zum
48 war
49 haben
50 nur
Platz 51–60
Platz Wort
51 oder
52 aber
53 vor
54 zur
55 bis
56 mehr
57 durch
58 man
59 sein
60 wurde
Platz 61–70
Platz Wort
61 sei
62 In
63 Prozent
64 hatte
65 kann
66 gegen
67 vom
68 können
69 schon
70 wenn
Platz 71–80
Platz Wort
71 habe
72 seine
73 Mark
74 ihre
75 dann
76 unter
77 wir
78 soll
79 ich
80 eines
Platz 81–90
Platz Wort
81 Es
82 Jahr
83 zwei
84 Jahren
85 diese
86 dieser
87 wieder
88 keine
89 Uhr
90 seiner
Platz 91–100
Platz Wort
91 worden
92 Und
93 will
94 zwischen
95 Im
96 immer
97 Millionen
98 Ein
99 was
100 sagte

Im Duden-Korpus ist das häufigste Substantiv „Jahr“. Es folgen „Euro“, „Uhr“, „Prozent“ und „Deutschland“. Das Häufigkeitswörterbuch von Randall Jones und Erwin Tschirner 2015 wiederum umfasst gesprochenes und geschriebenes Deutsch. Gesprochenes basierend unter anderem auf in Deutschland erschienenen Fernsehsendungen. Auf Grund der Wahl der Korpora zeigt sich auch, dass derartige Häufigkeitslisten eher deutschlandlastig sind, in Österreich oder in der Schweiz würde das teils anders ausfallen („Mark“/„Euro“, „Paragraph“, „Deutschland“ usw.).

Für das Schweizer Hochdeutsch ist keine eigene Statistik bekannt.[5]

Die häufigsten Substantive, Verben, Adjektive, Pronomen und Zahlen

[Bearbeiten | Quelltext bearbeiten]

Bei den Substantiven, Verben und Adjektiven werden nur die jeweiligen Grundformen angegeben. Es wurde festgestellt, welches Wort häufig vorkam, und dessen Grundwort in der Liste vermerkt. Bei den Pronomen wurden die groß geschriebenen Höflichkeitsformen nicht berücksichtigt. Bei den Zahlwörtern konnten die Formen der Zahl eins nicht von denen des indefiniten Artikels unterschieden werden.

  • Werner König: dtv-Atlas zur deutschen Sprache (= dtv. Band 3025). 10., überarbeitete Auflage. Deutscher Taschenbuch-Verlag, München 1994, ISBN 3-423-03025-9, Worthäufigkeit, S. 114–115 (256 S.).
  • Friedrich Wilhelm Kaeding (Hrsg.): Häufigkeitswörterbuch der deutschen Sprache. Festgestellt durch einen Arbeitsausschuß der deutschen Stenographie-Systeme. (= Grundlagenstudien aus Kybernetik und Geisteswissenschaft. Band 4). Schnelle, Quickborn bei Hamburg 1963, S. 648–671 (Faksimile-Druck der Originalausgabe, Selbstverlag des Herausgebers, Steglitz bei Berlin 1897. 55 Seiten; Beiheft zu Band 4).
    • 1. Teil: Wort- und Silbenzählungen (auszugsweise Reproduktion).
    • 2. Teil: Buchstabenzählungen (Auszug aus dem Nachtrag).
  • Helmut Meier: Deutsche Sprachstatistik. Mit einem Geleitwort von Lutz Mackensen. Georg Olms, Hildesheim 1967.
    • Band 1: Bausteine zu einer vergleichenden Sprachstatistik. 2., erweiterte und verbesserte Auflage, XIII, 406 S.
    • Band 2: Relative Häufigkeitswerte zu den 512 häufigsten deutschen Wortformen, 150 S.
  • Helmut Meier: Deutsche Sprachstatistik. 2. erweiterte Auflage. 2 Bände in 1 Band. Georg Olms, Hildesheim 1978 (422 und 150 Seiten).
  • Arno Ruoff (Hrsg.): Häufigkeitswörterbuch gesprochener Sprache. Gesondert nach Wortarten alphabetisch, rückläufig-alphabetisch und nach Häufigkeit geordnet. Unter Mitarbeit von Harald Fuchs (= Idiomatica. Band 8). 2. unveränderte Auflage. Niemeyer, Tübingen 1990, ISBN 3-484-24008-3 (517 S.).
  • Günther Thomé, Dorothea Thomé: Häufige Wörter. Basiskonzept Rechtschreiben. Was ist einfach? Was ist schwierig? 3., erweiterte Aufl. (kompl. Ökoproduktion). Oldenburg: isb-Fachverlag 2021 (ISBN 978-3-942122-25-2, 68 Farbseiten, 6,80 €, Leseprobe unter: www.isb-oldenburg.de).

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Anmerkung: Kaedings Häufigkeitswörterbuch wurde nach jahrelangen Zählungen im Jahr 1897 veröffentlicht.
  2. George A. Miller: Wörter. Streifzüge durch die Psycholinguistik. Herausgegeben und aus dem Amerikanischen übersetzt von Joachim Grabowski und Christiane Fellbaum. Spektrum der Wissenschaft, Heidelberg 1993; Lizenzausgabe: Zweitausendeins, Frankfurt am Main 1995; 2. Auflage ebenda 1996, ISBN 3-86150-115-5, S. 303.
  3. Vgl. Wortschatz-Portal der Universität Leipzig.
  4. http://pcai056.informatik.uni-leipzig.de/downloads/etc/legacy/Papers/top1000de.txt
  5. Welches ist das häufigste Substantiv im Deutschen? In: Tages-Anzeiger. ISSN 1422-9994 (tagesanzeiger.ch [abgerufen am 11. November 2020]).