KOI8-U
KOI8-U aus der KOI8-Familie ist ein Zeichensatz, der für die Zeichenkodierung des kyrillischen Alphabetes für die ukrainische Sprache in Computersystemen benutzt wird und verwendet nur ein einzelnes Byte zur Kodierung.
KOI8-U ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des Lateinischen Alphabets. KOI8-U teilt viele Eigenschaften mit KOI8-R für Russisch. Der internationale Zeichensatz-Standard Unicode ersetzt KOI8-U vollständig.
KOI-U ist beschrieben in RFC 2319[1] und ist IANA-registriert und für MIME zugelassen.
Tabelle
[Bearbeiten | Quelltext bearbeiten]…0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0… | ungenutzt | |||||||||||||||
1… | ||||||||||||||||
2… | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4… | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5… | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6… | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7… | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8… | ─ | │ | ┌ | ┐ | └ | ┘ | ├ | ┤ | ┬ | ┴ | ┼ | ▀ | ▄ | █ | ▌ | ▐ |
9… | ░ | ▒ | ▓ | ⌠ | ■ | ∙ | √ | ≈ | ≤ | ≥ | NBSP | ⌡ | ° | ² | · | ÷ |
A… | ═ | ║ | ╒ | ё | є | ╔ | і | ї | ╗ | ╘ | ╙ | ╚ | ╛ | ґ | ╝ | ╞ |
B… | ╟ | ╠ | ╡ | Ё | Є | ╣ | І | Ї | ╦ | ╧ | ╨ | ╩ | ╪ | Ґ | ╬ | © |
C… | ю | а | б | ц | д | е | ф | г | х | и | й | к | л | м | н | о |
D… | п | я | р | с | т | у | ж | в | ь | ы | з | ш | э | щ | ч | ъ |
E… | Ю | А | Б | Ц | Д | Е | Ф | Г | Х | И | Й | К | Л | М | Н | О |
F… | П | Я | Р | С | Т | У | Ж | В | Ь | Ы | З | Ш | Э | Щ | Ч | Ъ |
Die Unterschiede zu KOI8-R sind an den Positionen A4hex, A6hex, A7hex, ADhex und B4hex, B6hex, B7hex, BDhex (in obiger Tabelle farblich hervorgehoben), wo die vier zusätzlich benötigten Buchstaben kodiert sind.
Während RFC 2319[1] sagt, dass 95hex Unicode U+2219 (∙) sein soll, wird es oft in U+2022 (•) umgesetzt, wegen der Kompatibilität mit Codepage 1251. Einige Referenzen haben einen Tippfehler und ordnen fehlerhafterweise B4hex U+0403 zu, anstatt des korrekten U+0404. Dieser Tippfehler befindet sich auch im Anhang A von RFC 2319, aber die Tabelle im Haupttext ist korrekt.