Portal Diskussion:Unicode

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Portal Diskussion:Unicode/Übereinkünfte)
Letzter Kommentar: vor 11 Stunden von Antonsusi in Abschnitt Unicodeblockseiten
Zur Navigation springen Zur Suche springen
Diese Diskussionsseite dient dazu, Verbesserungen an der Portalseite „Unicode“ zu besprechen. Persönliche Betrachtungen zum Thema gehören nicht hierher. Für allgemeine Wissensfragen gibt es die Auskunft.

Füge neue Diskussionsthemen unten an:

Klicke auf Abschnitt hinzufügen, um ein neues Diskussionsthema zu beginnen.
Dieser Baustein verhindert die automatische Archivierung dieses Abschnitts und seiner Unterabschnitte.

Die "Unifont" genannte grobe Rasterschriftart wird hier nicht als brauchbare adäquate Schrift betrachtet und taucht deshalb nicht in der Tabelle auf.

Ein Font zur Ersatzdarstellung für fehlende Zeichen ist "Unicode BMP Fallback SIL", zu finden unter sil.org. Leider ist er nur für Version 6.1.
Eine gute Quelle für viele Fonts, welche einzelne Blöcke abdecken, sind die Noto-Fonts (Download). Sie enthalten aber keine in Unicode-Version 9.0.0 oder später neu definierten Zeichen.

Auf Github sind OTF-Dateien unter dieser Adresse zu finden.

Gesucht werden Fonts für folgende Blöcke (kürzlich Erledigtes bleibt in der Tabelle):
Block Font und -Version Anzahl fehlender Zeichen
U+1D800: Sutton-Zeichenschrift (neu in 8.0.0) Signwriting 2010 4


Erledigt sind alle von den Noto-Fonts abgedeckten Blöcke.

Zeichensuche

[Quelltext bearbeiten]
Dieser Baustein verhindert die automatische Archivierung dieses Abschnitts und seiner Unterabschnitte.

Tipp: Wer unter Microsoft Windows öfters exotische Zeichen in Fließtexte einfügen will, der kann unter dieser Webadresse BabelMap downloaden.

Grafiktafeln und fehlende Zeichen

[Quelltext bearbeiten]
Dieser Baustein verhindert die automatische Archivierung dieses Abschnitts und seiner Unterabschnitte.

Aufgrund fehlender oder alter Fonts gibt es Blöcke, für die ich keine vollständigen Grafiktafeln erstellen kann. Ich benötige dazu immer einen freien (!) Font, welcher alle definierten Zeichen eines Blocks darstellt. Es kann auch eine Gruppe von Fonts sein, welche zusammen alle Zeichen umspannen. Ebenso muss es für die Grafik kein Unicodefont sein, da die Zeichen ja als Bild dargestellt werden. Die Zeichen können also auch auf den Bereich bis U+00FF "gepatcht" sein. Ich möchte daher einiges abklären:

  1. Wer kennt (Nicht-) Unicodefonts für die oben unter "Fontsuche" genannten fehlenden Bereiche ? Die Suche bei www.Fonst2u.com ist jedenfalls extrem mühsam. Ein paar Tipps wären gut. Die Zeichen sollten idealerweise eine gewisse Ähnlichkeit mit den Darstellungen in den PDF-Dateien von Unicode haben.
  2. Sollen auch Grafiken in die Artikel, bei denen noch einige Zeichen fehlen ? Ein Beispiel ist unter Unicodeblock Arabisch zu finden.
Gruß von ÅñŧóñŜûŝî (Ð) 17:17, 23. Okt. 2012 (CEST)Beantworten

Unicodeblock Albanisch

[Quelltext bearbeiten]

Ich wundere mich, ob Albanisch tatsächlich der offizielle deutsche Name für den Elbasan-Block ist. Es ist richtig, dass das Elbasan-Alphabet für die albanische Sprache verwendet wurde, aber das trifft auch bspw. auf Vithkuq-Alphabet zu. Laut dem Proposal und dem englischen Artikel über das Elbasan-Alphabet, wurde es sowieso nur zeitlich und quantitativ sehr begrenzt benutzt, weshalb auch deswegen der allgemeine Name Albanisch meiner Meinung nach unpassend ist. --qKXD 11:17, 11. Jul. 2023 (CEST)Beantworten

Tabellenspalte bei Unicodeblock_Verschiedene_Symbole#ARIES mit Unicodeblock Variantenselektoren

[Quelltext bearbeiten]

vgl. dazu Wikipedia:Fragen_zur_Wikipedia#Sternbild-Zeichen_im_Text_nicht_bunt,_sondern_schwarz. --Enhancing999 (Diskussion) 00:32, 30. Dez. 2023 (CET)Beantworten

Zeichensuche in der Wikipedia

[Quelltext bearbeiten]

Die Zeichen haben ja eigene Namen, die oft recht systematisch aufgebaut sind und auf Deutsch und Englisch alle auf den entsprechenden Wikipedia-Artikeln zu den einzelnen Blöcken stehen. Daher bietet es sich an, nach entsprechenden Schlagworten suchen zu wollen. Allerdings ist das unpraktisch, wenn das, was man sucht, als normales Wort auch an vielen anderen Stellen der Wikipedia vorkommt. Es gibt eine Lösungsmöglichkeit, die man in Liste der Rechtsnormen der Bundesrepublik Deutschland bewundern kann:

{{#tag:inputbox|
type=fulltext
searchbuttonlabel=suchen
prefix=Unicodeblock}}

ergibt:

Es wäre schön, wenn so etwas an geeigneter Stelle, zum Beispiel bei Liste der Unicodeblöcke, dem Leserkreis zugänglich wäre. --193.28.249.9 13:54, 22. Jul. 2024 (CEST)Beantworten

Artikel Unicode spacing modifier letters

[Quelltext bearbeiten]

176.2.2.158 06:30, 4. Aug. 2024 (CEST) s untenBeantworten

was wird denn da für eine Bedeutung modifiziert?

[Quelltext bearbeiten]

... (im 2ten Satz). hat zb "5" eine bedeutung, und kann die modifiziert werden, und zu welcher neuen Bedeutung? ... will sagen, da fehlt ein ganzer erläuternde Abschnitt mit vllt einen Beispiel. oder ein Baustein "unfertig unverständlich". 176.2.2.158 06:23, 4. Aug. 2024 (CEST)Beantworten

[Quelltext bearbeiten]

Habe bei den Weblinks im Artikel Unicode etwas aufgeräumt, aber hier ist immer noch Wildwuchs

Die weiterführenden Informationen sind einfach zu viel, hier gehört noch ordentlich entschlackt - im Prinzip ist es derzeit eine Linksammung die das was im Artikel erklärt wird, meistens nochmal anders erklären. Meistens allerdings nicht in deutscher Sprache, sondern englisch - das ist für den Leser in der de-Wikipedia nicht ideal.

Würde hier vorschlagen, die Liste allgemein noch zu kürzen und dann ggf. 2 bis 3 belassen - da von 2 in deutscher und meinetwegen einer in englischer Sprache - Meinungen? --suit 12:34, 8. Aug. 2024 (CEST)Beantworten

In meinen Augen reichen Wiktionary, Commons und die offizielle Website vollkommen aus. Für die anderen sehe ich keinen Mehrwert, schon gar nicht im Übersichtsartikel. --Morten Haan 🚣 Wikipedia ist für Leser da 23:27, 8. Aug. 2024 (CEST)Beantworten
Die offizielle Website würde ich sogar rausnehmen, im Übersichtsartikel den Deeplink des Standards, ggf. die Übersicht zu den Codecharts um zu sehen was so drinnen ist. Die Homepage des Unicode-Consortium hat dort eigentlich nichts verloren und "alle Zeichen in einer Tabelle (mit Namen und Eigenschaften der Zeichen, text/csv)" hilft dir dann auch nicht weiter, da sind die segmentieren Codierlisten hilfreicher. UniView hab ich ergänzt, weil es mit Abstand das am besten gewartete Tool ist, kommt auch direkt von einem Unicode-Editor der auch die Codepages verfasst - damit habe ich 3 andere mehr Tools ersetzt, die mehr schlecht als recht sind. Bei einem Artikel dieser Art brauchts aber schon etwas mehr weiterführende Info - nur sollte die halt weiterführend sein --suit 10:10, 9. Aug. 2024 (CEST)Beantworten
@ "alle Zeichen in einer Tabelle (mit Namen und Eigenschaften der Zeichen, text/csv)" hilft dir dann auch nicht weiter
  • Also, seit es Unicode gibt, habe ich immer auf der Festplatte eine aktuelle Datei als plain text, alco mit einem codepoint pro Zeile und den vielen Semikolonsen. Schreibgeschützt gegen Unfälle.
  • Das ist ideal zum Navigieren und Suchen nach Codes, oder in einem guten Text-Editor alle Zeilen anzeigen, die STAR enthalten oder DIGIT oder SPACE oder HYPHEN. Notfalls mit Unix-Kommando.
  • Mit 85 oder sonstwie vielen PDF kommt man da nicht klar; die habe ich für mich interessierende Ranges auch auf der Platte.
  • Eine derartige Verlinkung muss auf jeden Fall verbleiben.
@ Die Homepage des Unicode-Consortium hat dort eigentlich nichts verloren
  • Äh, unicode.org als zentraler Einstieg in deren Navigation ganz ganz sicher.
VG --PerfektesChaos 12:48, 9. Aug. 2024 (CEST)Beantworten
Du suchst ernsthaft in einem Textfile nach Codepunkten? Das von den Unicode-Menschen empfohlene Tool UniView sagt dir nichts? Ok, jeder wie er meint.
Bez. der offiziellen Website als zentralen Einstieg - der Artikel dreht sich um den Unicode-Standard unicode.org ist die Website des Unicode Consortium und nicht des Standards, der Standard wird nur in einem kleinen Teilbereich der Website abgewickelt. Das wäre wie wenn man bei Hypertext Markup Language einfach un'schaut auf die W3C-Website verweist. Mir ist schon klar, dass es hier eine namensähnlichkeit gibt (die natürlich durch den Zusammenhang entsteht) aber Unicode-Standard != The Unicode Consortium (mit dem Unicode Technical Committee sowie dem CLDR Technical Committee und vielen anderen). Diese Vermischung von Themen führt im übrigen auch dazu, dass im Artikel Unicode-Konsortium gut die hälfte nichts mit dem Lemma zu tun hat, besonders der Abschnitt "Geschichte" Beschäftigt sich mit der geschichte von Zeichencodierungen bis zur Gründung des Unicode Consortium, aber ignoriert alles danach. Nachdem ich eben nicht wie mit der Axt im Wald durchpflügen möchte, braucht es hier grundsätzlichen Input.
Darum nochmal die Frage um auf Nummer sicher zu gehen: was ist das Thema des Lemmas Unicode und gibt es hier ggf. nicht eine massive Verwässerung? --suit 15:48, 9. Aug. 2024 (CEST)Beantworten
unicode.org kann ich mir merken und von dort an allen sonstigen Ankündigungen vorbei zu den vielfältigen technischen Dokumenten navigieren. Wikipedia hat auch eine Hauptseite, ein Autorenportal und sonst noch allerlei Meta, aber auch einen ANR. Du forderst, man müsse den Wikipedia-ANR direkt verlinken; das wird nicht funktionieren.
Ich brauche kein Tool, muss nicht online sein, und kann mit regulären Ausdrücken zu mich interessierenden Schlagwörtern eine Trefferliste in meinem Text-Editor darstellen, wie immer es mir gerade passt. Und das seit fast drei Jahrzehnten.
  • Wer mag, kann auch aus der genannten Datei per Semikolon-CSV in OpenOffice oder sonstwas sein privates Spreadsheet, Datenbank oder dergleichen mit ein paar Klicks generieren. Oder in eigene Tools und Software integrieren, was immer benötigt wird.
Der Schwerpunkt sind natürlich die Codepoints; aber wer die vom Himmel schmeißt, wie die zustande kommen, wer die pflegt und Emojis definiert ist zweifelsfrei ebenfalls wesentlicher Teil des Artikels. Genauso die Vorgeschichte und Motivation Ende der 1980er.
VG --PerfektesChaos 16:05, 9. Aug. 2024 (CEST)Beantworten
kann man so stehen lassen - was ist deine Meinung zu den restlichen Weblinks? --suit 16:10, 9. Aug. 2024 (CEST)Beantworten
  • SELFHTML ist nochmal eine schöne deutschsprachige einfache Einführung. Außerdem die geforderte Sicht von außen.
  • Die Abschnitte Unicode-Standard und Werkzeuge/Software mit drei bzw. zwei Weblinks tun nicht weh; die drei bei Standard sind ohnehin essentiell und der Kern der ganzen Chose.
  • unicode.org als universellen Startpunkt hatten wir schon.
  • Rest mag so bleiben, oder um ein, zwei, drei gekürzt werden. Aber der Heise-Einstieg ist auch wieder allgemeinverständlich.
  • Die sonstigen englischsprachigen wären eher für Profis interessant und verständlich und nutzbar, und die können sich das auch selbst suchen und unter unicode.org ist letztlich auch alles englisch beschrieben.
VG --PerfektesChaos 12:08, 10. Aug. 2024 (CEST)Beantworten

Unicodeblockseiten

[Quelltext bearbeiten]

Ich bin gerade im Artikel Thaana über den höchstaktuell klingenden Satz ...

Thaana belegt die Unicode-Zeichen 1920–1983 (hexadezimal 0x780–0x7BF, siehe auch Unicodeblock Thaana) und wird unter anderem von Windows XP unterstützt.

... gestolpert und dachte mir so "wirklich 'von'? nicht 'ab'?" und klickte mal zum Unicode-Block weiter, um da vielleicht mehr zu finden, aber reine Tabelle wie auch die beiden "Nachbarn" Teladingens und Thailändisch. Wäre es nicht eine sinnvolle Ergänzung, auf diesen Seiten zu ergänzen "Der Block wurde mit der Unicode Version 47.11 im Jahre 0815 eingeführt (damit könnte man schon leichter erraten, ob damals evtl. erst Win XP "neu" war) (und x-mal ergänzt) (und wurde ab Windows XY, Linux YZ und Mac ZX offiziell unterstützt, wenn's ganz perfekt sein soll)"? Ich lasse das mal hier als Frage liegen an die, die die passenden Infos eh neben sich liegen haben ... --Mueck (Diskussion) 11:49, 5. Okt. 2024 (CEST)Beantworten

Die Unicode-Version wäre sicherlich gut zu ergänzen. Betriebssysteme sind da schon schwieriger. Ein Betriebssystem kann entweder gar kein Unicode, oder Unicode nur Plane 0 (U+0000 bis U+FFFF) oder Unicode komplett (alle Ebenen). Das ist dan eher im Artikel über das BS zu erwähnen. Wenn ein Betriebssystem unicodefähig ist, dann kann es alle Zeichen einer Ebene darstellen, wenn es eine Schriftart mit den Zeichen hat. Ob passende Schriften im "Lieferumfang" des Betriebssystems enthalten sind, ist eine andere Frage. ÅñŧóñŜûŝî (Ð) 12:25, 5. Okt. 2024 (CEST)Beantworten
Stimmt ...
Dann also eher "Der Block wurde mit der Unicode Version 47.11 in Plane x im Jahre 0815 eingeführt, OS-Unterstützung siehe ]allgemeine Seite dazu, gips bestimmt ...][" --Mueck (Diskussion) 16:13, 5. Okt. 2024 (CEST)Beantworten

Richtig. Ich suche nach Daten. ÅñŧóñŜûŝî (Ð) 16:35, 5. Okt. 2024 (CEST)Beantworten