Zahlensysteme und grafische Darstellung von Zeichen

Den letzen Beitrag beendete ich mit dem nachfolgendem Symbol, heute würde ich gerne erklären, was es damit auf sich hat, insbesondere wie die grafische Darstellung von Zeichen überhaupt möglich wird. 

Die Tatsache, dass hinter Bilder, Texten,  Webseiten und generell jeglicher Art von digitalisierten Medien im Hintergrund Zahlen stecken, dürfte aus den vergangenen Beiträgen klar geworden sein. Demnach stellt man sich die Frage absolut berechtigt, wie aus 245 unser beliebtes Paragraphenzeichen beispielsweise entstehen kann.

Hierfür kann u.a. der ASCII (American Standard for Codes Information Interchange) – Code  herangezogen werden. Bei dieser handelt es sich um eine Abbildungsvorschrift = Norm zur standardisiert festgelegter Kodierung von Zeichen im binären Zahlensystem. Es umfass Klein- sowie Großbuchstaben, die arabischen Ziffern sowie Sonderzeichen. Der Code nutzt hierbei 8 Bits (=1 Byte), nutzt jedoch das erste Bit nicht, so dass im Endeffekt 128 verschiedenen Zeichen dargestellt werden können. Der Code kann zusätzlich durch speziellen Erweiterungen in soweit erweitert werden, dass die Darstellung von 256 Zeichen möglich wird.

Texte entstehen durch Aneinanderreihung der einzelnen Bytes, die jeweils ein einzelnes Zeichen kodieren. Hierbei wird  eine Zeichenkette gebildet, ähnlich unserer Paragraphenketten aus dem Verwaltungsrecht, jedoch ohne Punkt, Komma oder ähnliches. Die Unterschiede der existierenden Programmiersprachen ergeben sich z.B. durch die verschiedenen Verfahren zur Identifikation der Enden der Zeichenketten. Zum Beispiel:

Die Programmiersprache Pascal legt die Länge der Zeichenkette im ersten oder in den ersten beiden Bytes bereits vor der Kette fest, während die Programmiersprache C/C++ ein “0”-Byte verwendet, um das Ende der Kette zu kennzeichnen. Bei letzterem handelt es sich um einen Byte, in dem alle Bits “0” sind).

Wie die einzelnen Zeichen im ASCII-System  in den verschiedenen Zahlensystemen aussehen lässt sich  z.B: hier  nachschlagen.

Wie oben bereits angesprochen, lassen sich mit dem ASCII-Code nur 256 Zeichen darstellen. Mit der Menge dürfte wohl nur ein kleiner Bereich einzelner asiatischer Sprachen darstellen lassen, insbesondere wenn man die Sonderzeichen auch verwenden möchte. Über diese Problematik verhilft Unicode. Dieses System ist nämlich in der Lage, Zeichen auf der gesamten Welt in jeglicher Sprache darzustellen, vorausgesetzt der Computer/ das Programm ist mit dem System kompatibel. Die Zeichenwerte wurden früher ausschließlich durch eine zwei Byte lange Zahl ausgedrückt, so dass bis zu 65536(2 Byte= 16 Bit = 216 ) unterschiedliche Zeichen katalogisiert werden konnten. Dies scheint zwar sehr viel zu sein, man würde nicht meinen, dass die Menge jemals ausgeschöpft werden könnte. Doch das System kennt unter anderem auch Zeichen aus historischen Schriften, so dass seit der Version 3.1 mehr als 94.000 Zeichen registriert wurden. Das 2-Byte-System musste dementsprechend vom 4-Byte-Schema abgelöst werden.

Die Darstellung erfolgt heute im hexadezimal- System mit einem U+ am Anfang , zusammenhängende Bereiche können mit einem X als Platzhalter verwendet werden.

https://i.stack.imgur.com/c71FY.png

Unicode katalogisiert die Zeichen außerdem nach Klassen und ordnet ihnen jeweils einen Zahlenwert zu. Darüber hinaus erhalten Zeichen auch Eigenschaften, zB über die Schreibrichtung. Verwaltet wir das System von der zentralen Organisation Unicode Consortium, gegründet in 1991. Somit wird die Zuordnung der einzelnen Zeichnete auch einheitlich verbindlich. Bei neuen Unicode-Versionen wird auch das Buch “The Unicode Standard” neu aufgelegt, da dieses alle Zeichen, Zeichenwerte sowie Klassen etc. klassifiziert und strukturiert aufgeteilt enthält.  Hierbei handelt es sich um in etwa das verbindliche Normwerk des Unicode-Systems, ähnlich unserem Grundgesetz nach dem Art 19 III.

Selbstverständlich gibt es sehr viele unterschiedliche Kodierungen, doch die zwei dürften die wichtigsten sein. Jedoch noch ein kurzer Hinweis: bei den aus dem Alltag und aus den Supermarkts bekannten Bar-/ Strichcodes handelt es sich ebenso um ein System zur Kodierung von Zeichen und Zahlen. Diese werden zwar nicht intern im PC verwendet, doch werden von diesen dekodiert, um sodann in einer anderen Kodierung, zB. ASCII gespeichert zu werden. Hierbei wird das System der Code39, Code 128 oder UPC/EAN, Interleaved 2/5 (I/5) oder Codabar verwendet. Gemeinsamkeit dieser Codes ist das Verwenden von X-“Mass”, der die schmalste Stelle oder schmalsten Strich im Code bezeichnet. Dieser bezieht sich auf die Dichte, also auf die Informationsfülle die in einem bestimmten Bereich, über eine bestimmte Strecke erfasst werden kann. Weiterführende Hinweise und Informationen können in diesem sehr anschaulich und einfach erklärten Beitrag bei Interesse nachgelesen werden.

Quellen:

s.Bilder & Verweise

Herold, Lurz, Wohlrab- Grundlagen der Informatik, 2. Auflage.

Teile diesen Beitrag

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.