Teachers Paradise School Supplies Teacher Resources Free Encyclopedia
Teachers Paradise FREE Teaching Resources
Home Arts Crafts Audio Visual Equipment Office Supplies Teacher Resources
Hauptseite | See live article

Unicode

Unicode ist ein internationaler Standard, dessen Ziel es ist, einen Code für jedes graphische Zeichen oder Element aller bekannten Schriftkulturen und Zeichensysteme festzulegen. Er will das Problem der verschiedenen inkompatiblen Kodierungen in den unterschiedlichen Ländern beseitigen. Die bestehenden Standards erforderen einen hohen Konvertierungsaufwand beim Datenaustausch, wenn eine Konvertierung überhaupt möglich war. Dadurch, dass die meisten Zeichenkodierungen nur wenige Sprachen unterstützen, war es in der Praxis oft unmöglich verschiedene Sprachen im selben Text zu verwenden.

Table of contents
1 Unicode Consortium
2 Codes
3 Schriftarten
4 Versionen
5 Beispiel
6 Unicode Transformation Formats
7 Weblinks

Unicode Consortium

Das Unicode Consortium (eine Vereinigung mit Domizil in Kalifornien) publizierte 1991 eine erste Fassung des Standards und hat seither regelmäßig neue Fassungen herausgegeben, die jeweils der geleisteten Standardisierungsarbeit entsprechen.

Das Konsortium arbeitet mit der ISO-Organisation zusammen, die den Standard ISO 10646 herausgibt. Unicode und ISO 10646 sind gleichwertig, was die entsprechenden Codes für die Zeichen betrifft, aber der Unicode-Standard enthält bedeutend mehr Angaben für die Implementierer von Textverarbeitungslösungen (Darstellung, Sortierreihenfolgen, Schriften, die von rechts nach links laufen etc).

Codes

; Basic Latin : die ersten 128 Zeichen, U+0000 - U+007F, entrsprechen dem ASCII-Zeichensatz ; Ergänzende Zeichen für Sprachen, die das lateinische Alphabet benützen: U+0080 - U+024F ; IPA Ergänzungen : U+0250 - U+02FF ; Kombinierende diakritische Zeichen : U+0300 - U+036F ; Griechisch und Koptisch : U+0370 - U+03FF ; Kyrillisch : U+0400 - U+052F ; Armenisch : U+0530 - U+058F ; Hebräisch : U+0590 - U+05FF ; Arabisch : U+05600 - U+06FF ; Syrisch : U+0700 - U+074F

....

Schriftarten

Für die meisten Unicode-Zeichen gibt es frei erhältliche Schriftarten. Es werden auch kommerziell erhältliche Schriftarten angeboten.

Zu beachten ist, dass für eine Schriftart, die dem Unicode-Standard folgt, nur gilt, dass die Zeichen, die vorkommen, an dem vom Unicode vorgeschriebenen Platz zu finden sind. Es heißt nicht, dass ein entsprechendes Zeichen tatsächlich vorhanden sein muss. Es gibt einige Schriftarten, die nur ca. 600 Zeichen implementieren, was aber für viele Zwecke bereits genügt und einen bedeutenden Fortschritt gegenüber den 255 Zeichen der 8-Bit-Schriftarten darstellt.

Versionen

Beispiel

Unicode Transformation Formats

Für die Repräsentation der Unicode Zeichen, zum Zweck der elektronischen Datenverarbeitung, gibt es verschiedene so genannte Transformation Formats. In jedem der Formate lassen sich alle in Unicode enthaltenen Zeichen darstellen und Zeichenketten lassen sich beliebig zwischen den Formaten umwandeln. Einige Formate:

UTF-32 - UCS-4

Jedes Zeichen wird durch einen 32 Bit langen Code repräsentiert. Das hat z.B. den Vorteil, dass man schon an der Länge einer Zeichenkette erkennen kann, wieviele Zeichen enthalten sind. Ein Nachteil ist, dass mehr Speicherplatz verbraucht wird als bei UTF-16.

UTF-16 - UCS-2

Dies ist das älteste Format. Die Zeichen sind entweder 16 oder 32 Bit lang. Die Zeichen der lebenden Sprachen lassen sich so in 2 Byte darstellen.

UTF-8

UTF-8 ist auf
Unix-Systemen die populärste Kodierung für Unicode. Der große Vorteil gegenüber fast allen anderen Formaten ist, dass alle ASCII-Zeichen unverändert gültige Zeichen in UTF-8 sind. So funktionieren viele Programme, die den ASCII-Zeichensatz verwenden, unverändert auch mit UTF-8.

UTF-7

UTF-7 stellt Unicode Zeichen aus einer Reihe von ASCII-Zeichen mit jeweils nur 7 Bit dar.

Siehe auch: UTF-8 -- UTF-16 -- Alphabet

Weblinks




Pay for Educational Supplies & Teaching Supplies with Visa, Master Card, American Express, Discover or Paypal.
TeachersParadise.com HOME | Safe Shopping Guarantee | Help Desk
All trademarks & brands are the property of their respective owners.
Legal Notice 2000-2008 TeachersParadise.com, Inc. All Rights Reserved