Diskussion:Binärdatei/Archiv
Etymologie
Vielleicht könnte jemand etwas darüber schreiben, warum Binärdateien so heißen? Eine Datei aus 00110101100101010101110001011 besteht ganz offensichtlich aus Binärzeichen. Aber eine "nichtlesbare" Datei "binär" zu nennen bedarf schon einer Erklärung. Wer hat eine? --89.247.155.46 03:35, 25. Jul. 2010 (CEST)
- Ich kann dazu nur sagen: Sprache ist nicht logisch. -- Pemu 12:28, 29. Feb. 2012 (CET)
- Binärdatei ist das Komplement zu Textdatei. Binär heißt es wohl, weil in der Binärdatei alle binär möglichen Bitkombinationen auftreten können, in Textdateien nur die im Zeichensatz definierten.--VÖRBY (Diskussion) 18:15, 9. Jun. 2013 (CEST)
Kleinigkeiten und Grundsätzliches
Ich fühle mich zu den folgenden Anmerkung bemüßigt, weil IMHO der Artikel durch die letzten Änderungen, obwohl offensichtlich mit bester Absicht gemacht, ungenauer geworden ist.
Für mich etwas ganz Grundsätzliches zu diesem Artikel: Das Wort Binärdatei ist stark erklärungsbedürftig, gerade weil die Aussage binär kodiert eine Nullaussage ist. (1)
Im engeren Sinne hieße binär kodiert, dass in der Datei Zahlen im Zweiersystem gespeichert sind. Beispiel: eine unkomprimierte Raw-Audiodatei (wie in einer PCM-WAV-Datei hinter dem Header). Genaugenommen müsste man aber sagen, "Einwand – die Zahlen dabei sind nicht binär, sondern in Zweierkomplement-Darstellung kodiert". In einem weiteren Sinne jedoch besteht eine Textdatei aus z.B. Ascii-Zeichen, deren Werte als binär kodierte Zahlen in der Datei stehen. In diesem weiteren Sinne steht "binär" also im Widerspruch zu "nicht Textdatei". (2)
Ich habe keine Quelle oder Definition dafür, aber in dem von mir beobachteten Sprachgebrauch über die letzten Jahrzehnte scheint mit dem Begriff tatsächlich einfach nur "keine Textdatei im Sinne des auf meinem System vorhandenen Texteditors/type-/cat-Befehls" zu sein. (3)
Das Wort Binärdatei hat IMHO nichts im engeren Sinne mit seinen Bestandteilen zu tun – zumindest nicht mit "Binär-", sondern ist einfach nur ein Wort. (4)
Ich erkläre es mir immer so, dass wenn man binär kodierte Daten (z.B. Messwerte) in eine Datei schreibt, kriegt man eine Binärdatei. Aber ein Maschinenprogramm ist auch eine Binärdatei – auch wenn darin z.B. zwei Bytes (vorhanden an einer willkürlich ausgewählten Stelle) vielleicht erst einen Opcode, dann einen Operanden darstellen. Der Operand mag im Binärcode sein, der Opcode aber nicht – er ist halt ein Opcode. Trotzdem fällt es unter die geläufige Definition von Binärcode – öffnet man beides mit dem Texteditor, wird einem Menschen kaum ein Unterschied in den Geschmacksnuancen der beiden Buchstabensalate auffallen. (5)
Sorry, dass ich da so ausführlich drauf rumreite, aber das halte ich für das Verständnis dieses irgendwie unlogischen Begriffs für wichtig. Siehe z.B. obigen Hilferuf zur Etymologie. Daher habe ich, englischer Artikel hin oder her, den Begriff "binär" gelöscht. (6)
So, nun zu den Kleinigkeiten: Den ersten Absatz halte ich für eine Einleitung zu überladen. Schon der zweite Satz betrachtet einen Nebeneffekt (.doc-Datei im Texteditor zeigt Textfetzen, die man aus dem Text kennt). (7)
Es folgen viele gute Änderungen.
Nun kommen wir zu meinem Beispiel mit dem Rich Text Format. (Darauf kam ich, weil ich im Artikel gerne ein bisschen auf Textverarbeitung rumreiten würde, da IMHO gerade Anfängern der Unterschied zwischen einer Textdatei und einem Text, gespeichert in einer z.B. .doc-Datei, nicht sofort offenbar ist.) (8)
Ich bin jetzt nicht superfirm im RTF. Aber soweit ich mich erinnere, geht es ja gerade darum, dass es ein Dateiformat ist, das Textdateien erzeugt. Rich Text Format#Techniken sagt ja ziemlich klar, dass es eine Form der Textauszeichnung ist und dass es "reine Textdateien" sind. Unklar ist mir jetzt, wie z.B. Bilder eingefügt werden – sind es Verweise auf externe Dateien, werden sie irgendwie als Text kodiert eingebettet oder sind in der Tat Binärdaten eingebettet? Bei letzterem wäre es vielleicht ein schlechtes Beispiel, zumal es im Artikel ja eigentlich um Binärdateien und nicht Textdateien geht. Ich hoffte halt, ein kurzes und knackiges Beispiel von zwei Gegensätzen in einem Genre (den Textformaten) aufzuzeigen. (9)
-- Pemu (Diskussion) 21:28, 22. Mai 2013 (CEST)
Hallo Pemu, danke für deine Anmerkungen - zu denen ich meine Antworten unten gebe und die Referenzziffern direkt in deinen Text in kursiven/klein eingestreut (und einen Zeilenumbruch ergänzt) habe.
- (1) genau dazu ist eine Enzyklopädie da. Ich hielt die englische Fassung für korrekter und enzyklopädischer und habe deshalb die Einleitung angepasst.
- (2) Aber das 'Binär' sollte in der Einleitung unbedingt erklärt werden, egal wie.
- (3) OK, aber 'binär' muss erklärt werden.
- (4) Das kann so nicht sein, was 'Binär-' HEISST, muss auch 'binär' SEIN bzw. (enzyklopädisch) beschrieben sein. Und das hat etwas mit Binärcode zu tun - weshalb ich dorthin auch verlinkt habe.
- (5) So ist das (aus Englisch!) ja auch beschrieben, dass AUCH andere Texte darin enthalten sein können.
- (6) Das geht aber nicht, weil der Leser dann nicht weiß, warum das Ding 'binär...' heißt.
- (7) Ist aber für die Definition total wichtig - wie du selbst (Bsp. OP-Code) schreibst.
- (8) Das solltest du NICHT hier im Artikel tun, denn hier im Lemma wird ja genau das Gegenteil behandelt.
- (9) Ja, auch RTF enthält viele Binärdaten, das sind v.a. die Formatangaben, aber auch (wie du vermutest) Bildeinzüge etc. Auch wenn die (en:) Definition die Vermischung 'in Binär kann Text enthalten sein' zulässt, halte ich es (allerdings unbelegt) auch umgekehrt für richtig: In Text kann binär vorhanden sein - sonst dürfte ja eine Textdatei nicht mal Zeilenwechselzeichen (CRLF) enthalten. Vielleicht müsste das auch noch in die Einleitung rein.
Deine weitere Ergänzung (Word) halte ich HIER in diesem Lamma für unpassend, weil zu ausführlich: Was man sagen will, sollte auch ohne derart ausführliche Beispiele beschrieben werden können. Das 'binär codiert' formuliere ich zwischenzeitlich mal um. Grüße von --VÖRBY (Diskussion) 09:45, 23. Mai 2013 (CEST)
- Ergänzung: Für Word wird's fraglich: Wenn für 'Textdatei' definiert ist, dass dort auch Steuerzeichen etc. drin sein können (evtl. auch Grafikeinzüge), wo ist dann die Grenze zu den umfassenderen Binärdaten von Word? Definition missing! Wenn SVG ausschließlich oder (wie bei rtf) überwiegend mit Zeichen codiert ist, wäre das schon eine Textdatei - ähnlich wie der Quelltext für bestimmte Compiler - die auch z.B. Farb-Informationen in Binärform enthalten, aber trotzdem 'überwiegend' Text sind. --VÖRBY (Diskussion) 17:51, 23. Mai 2013 (CEST)
- In der Einleitung werden lediglich die Steuerzeichen zur Textuntergliederung (CRLF ...) als zu Textdateien gehörend beschrieben. Gleichezeitig wird zB eine Worddatei wegen der binär abgelegten Formatangaben etc.nicht mehr als 'Textdatei' bezeichnet - außer in der Umgangssprache. Die Definition sollte also klar sein. --VÖRBY (Diskussion) 18:10, 9. Jun. 2013 (CEST)
FTP
Ich habe einige Ergänzungen gemacht, wiedereinmal aus meinem ganz persönlichen Sprachempfinden heraus und unbelegt. Es geht um Steuerzeichen im ersten Absatz von "Hintergrund". Im folgenden Satz steht was über FTP und woran es über Binär- oder Textmodus entscheidet. Stimmt das so noch? -- Pemu (Diskussion) 12:37, 27. Mai 2013 (CEST)
- Zu FTP kann ich Details nicht bestätigen, m.W. muss ein Anwender angeben, ob binär oder Text. HIER sollte das aber lediglich als Beispiel aufgeführt werden. In Textdatei - und jetzt auch hier im Text - steht, dass in 'Textdateien' auch gewisse Steuerzeichen vorkommen. Das sollte genügen. Welche Programme dann mit diesen Dateien arbeiten oder ab nach welchen Kriterien sie Dateien als binär- oder Text interpretieren, sollte HIER m.E. nicht ausgeführt werden; es könnte zu Verwirrungen führen.
- Was aber m.E. noch offen ist: Gilt eine von Windows-Wordpad erstellte Datei - die ja auch Formatangaben wie Fett, Schriftart usw. enthält, ebenfalls noch als Textdatei? Wo verläuft also konkret die Grenze? Wie lautet die korrekte Definition? --VÖRBY (Diskussion) 17:36, 1. Jun. 2013 (CEST)
- Nein, lt. Einleitung in Textdatei nur Steuerzeichen für Textumbruch etc.
Analphabeten
Zitat: "Eine Binärdatei ist eine vom Menschen nicht lesbare Datei. Da es immer mehr Analphabeten gibt, werden damit immer mehr Dateien zu Binärdateien." – LOL. Wohl eher ein Fall für das Humorarchiv... Das nehm ich mal raus... vielleicht sollte der Satz sowieso umformuliert werden. --Doodee 03:18, 28. Sep 2004 (CEST)
Zusammenfassen mit Textdatei
Es gibt jetzt wie in der englischen Version einen Artikel Binärdateien und Textdateien, der Textdateien und Binärdateien gemeinsam abhandelt. So kann besser auf die oft unklare Unterscheidung eingegangen werden. Das, was hier schon steht, sollte mMn in den gemeinsamen Artikel eingearbeitet werden, und dieser Artikel sollte dann nur ein Redirect sein. --Doodee 02:28, 29. Sep 2004 (CEST)
- Gute Arbeit Doodee! sehe ich genauso, Redirekt auf Binärdateien und Textdateien. Da haben die Analphabeten doch was bewirkt :-)
- ist ok ... dann sollten wir aber auch Textdatei dorthin verschieben. Ich mach' mich schon mal an die Arbeit für die Binärdatei. Jonelo 19:03, 29. Sep 2004 (CEST)
- Erledigt-Baustein von Plankton314 (Diskussion) 13:27, 14. Feb. 2014 (CET) zurückgesetzt: Aus meiner Sicht ist das Zusammenlegen keine gute Idee. Beide Artikel haben andere Schwerpunkte, die Gemeinsamkeit ist lediglich, dass sie als Komplement zueinander gelten - was man ja einfach formulieren kann. So wird 'Binärdatei' auch in anderen Zusammenhängen benutzt und auch bei Textdatei sind spezifische Kriterien beschriebenn, die unterschiedliche Definitionen erläutern. Weitere Meinungen? --VÖRBY (Diskussion) 18:48, 14. Feb. 2014 (CET)
- VÖRBY, das ist eine fast zehn Jahre alte Diskussion.
- Der Artikel wurde zuerst nach Binärdateien und Textdateien, dann nach Binär- und Textdateien verschoben und anschließend gelöscht, weil zwischenzeitlich eigene Artikel "Textdatei" und "Binärdatei" entstanden sind. Redundanzdisk gab es hier: WP:Redundanz/Juni_2007#Bin.C3.A4r-_und_Textdatei_-_Bin.C3.A4rdatei_-_Textdatei.
- Das ist mal sowas von erledigt ;) --Plankton314 (Diskussion) 19:11, 14. Feb. 2014 (CET)