Diskussion:UTF-32
Byte ist eine adressierbare Speichereinheit, die groß genug ist, um ein beliebiges Zeichen der englischen Sprache aus dem Basis-Zeichensatz aufzunehmen. (bei ASCII: 1 Zeichen = 8 Bit = 1 Byte; bei UTF-32: 1 Zeichen = 32 Bit = 4 Oktette = 1 Byte ! Oder nicht? (nicht signierter Beitrag von 85.182.66.62 (Diskussion | Beiträge) 00:29, 17. Sep. 2005 (CEST))
- Nein. Bei ASCII waeren es 7 bit, bei Unicode 21. RedNifre 02:34, 15. Feb. 2008 (CET)
Das war früher mal. Heutzutage gilt 1 Byte = 8 Bit. (nicht signierter Beitrag von 80.135.161.31 (Diskussion | Beiträge) 06:34, 25. Feb. 2009 (CET))
- Falsch. Vgl. Datenwort, Byte. --Benji 00:18, 26. Feb. 2009 (CET)
Auch ASCII Zeichen werden in 8 Bit codiert, wobei nur die hinteren 7 verwendet werden, beim erweiterten ASCII / ANSI sind es die vollen 8 Bit (z.B. im ISO-8859-n) Interessant bei UTF-16 und UTF-32 ist auch daß Nullbytes enthalten sein können. Textinterpreter, welche das Nullbyte als String-Ende interpretieren, können hier Probleme bekommen. Auch ein wichtiger Aspekt für C-Programmierer. (nicht signierter Beitrag von 37.209.77.237 (Diskussion) 22:47, 12. Dez. 2012 (CET))
Angeblicher Vorteil des O(1)-Zugriffes
[Quelltext bearbeiten]Der Vorteil existiert nur, wenn man 1 Zeichen = 1 Codepoint festlegt. Je nach Unicode-Normalisierungsform brauchen Zeichen mit Diakritika aber mehr als einen Codepoint, etwa wenn ein Ü als <U+0055 U+0308> kodiert wird (wie es z.B. bei OS X geschieht). Für viele Zeichen-Diakritika-Kombinationen existieren auch gar keine "pre-composed" Zeichen, so dass man diese mit mehreren Codepoints ausdrücken muss, etwa kyrillische Vokale mit Betonungszeichen. Wer also meint, mit der Verwendung von UTF-32 müsse er sich um Zeichenkodierungen mit variabler Länge nicht mehr herumplagen, macht es sich zu einfach oder unterstützt (ggf. unwissentlich) nur eine Teilmenge von Unicode. :-( --RokerHRO 10:42, 15. Mär. 2010 (CET)
Unicode Standard
[Quelltext bearbeiten]"Im aktuellen Unicode Standard 5.1 [...]", das ist doch nicht mehr im Ansatz aktuell, oder? Wir sind inzwischen bei v11. Felix D. (Diskussion) 11:40, 9. Sep. 2018 (CEST)