Magic-Byte

Magic-Byte
Dieser Artikel oder Abschnitt bedarf einer Überarbeitung. Näheres ist auf der Diskussionsseite angegeben. Hilf mit, ihn zu verbessern, und entferne anschließend diese Markierung.

Eine Magische Zahl (engl. magic number) ist in der Programmierung ein spezieller Wert, der für einen bestimmten Zweck, beispielsweise für die Kennzeichnung von Dateiformaten am Dateibeginn, genutzt wird.

Magische Zahlen werden meistens ausgewählt aus:

  • ASCII (meistverwendet)
  • hexadezimale Repräsentation von Zahlen (beispielsweise 305419896 = 0x12345678)
  • Manchmal wird Hexspeak verwendet

Inhaltsverzeichnis

Magische Zahlen zur Kennzeichnung von Dateitypen

Eine frühe Konvention in unixartigen Betriebssystemen war, dass Binaries mit zwei Bytes anfingen, die eine „Magische Zahl“ einhielten, die den Typ der Datei angibt. Am Anfang wurden damit Objektdateien für verschiedene Plattformen gekennzeichnet. Nach und nach wurde dieses Konzept auch auf andere Dateien übertragen, und mittlerweile findet sich in fast jeder Binärdatei eine magische Zahl.

Viele andere Typen von Dateien haben einen Inhalt, der den Dateitypen identifiziert. So fängt XML mit den speziellen Zeichen <?xml an, der die Datei einwandfrei als XML kennzeichnet. Wandelt man diesen Dateianfang in eine Zahl um, kann man anhand eines einfachen Vergleiches schnell den Dateityp bestimmen, ohne viel über das Format wissen zu müssen.

Einige Beispiele:

  • Die Stelle mit wichtigen Netzwerkparameter des BOOTP/DHCP beginnen mit einem "Magical Cookie" 0x63825363.
  • kompilierte Java-Klassendateien (Bytecode) beginnen mit 0xCAFEBABE.
  • GIF-Bilddateien enthalten am Anfang den ASCII-Code für ‚GIF89a‘ (0x474946383961) oder ‚GIF87a‘ (0x474946383761)
  • JPEG/JFIF-Bilddateien fangen mit 0xFFD8FF an und enthalten weiterhin den ASCII-Code für ‚JFIF‘ (0x4A464946).
  • PNG-Bilddateien beginnen mit einer 8-Byte-Signatur, die die Datei als PNG identifiziert und eine Erkennung von Dateiübertragungsproblemen ermöglicht: \211 P N G \r \n \032 \n (0x89504e470d0a1a0a)
  • Standard-MIDI-Dateien enthalten den ASCII-Code für ‚MThd‘ (0x4D546864) gefolgt von Metadaten.
  • Scripte aller Art starten normalerweise mit einem Shebang, ‚#!‘ (0x23 0x21), gefolgt von einem Pfad zum Interpreter (z.B. ,#!/usr/bin/perl‘ für Perl)
  • Alte MS-DOS-exe-Dateien und neuere Microsoft-Windows-PE-exe-Dateien (Portable Executable) starten mit dem ASCII-Code ‚MZ‘ (0x4D5A) bzw. selten auch ‚ZM‘ (0x5A4D), die Initialen des Erfinders dieses Formats, Mark Zbikowski.
  • Der Berkeley Fast File System Superblock wird identifiziert durch 0x19540119 oder 0x011954 je nach Version; beides ist das Geburtsdatum des Designers Marshall Kirk McKusick.
  • Programme für den Game Boy und Game Boy Advance haben eine 48 oder 156 Byte lange magische Zahl. Diese Zahl enkodiert ein Bitmap des Nintendo-Logos.
  • Alte Fat Binaries (die Code für sowohl den 68K- als auch den PowerPC-Prozessor enthalten) auf Mac OS 9 beginnen mit dem ASCII-Code von ‚Joy!‘ (engl. Freude!) (0x4A6F7921).
  • TIFF-Bilddateien fangen mit „II“ oder „MM“ an, abhängig von der Endianess (II entspricht Intel, MM entspricht Motorola), gefolgt von 0x2A00 bzw. 0x002A (im Dezimalsystem 42).

Das Unix-Kommando file liest und interpretiert magische Zahlen aus Dateien. Auch das Linux-Kernelmodul binfmt_misc erkennt anhand magischer Zahlen den Dateityp einer Anwendung.

Magische Zahlen in Code

Der Term magische Zahl (engl. magic number) bezeichnet auch den schlechten Programmier-Stil, Zahlen direkt im Quellcode zu benutzen. In vielen Fällen macht dies Programme schwerer lesbar und unverständlich. Besser kann es sein, Zahlen mit Bedeutung als Konstante zu definieren und so mit einem Namen zu versehen. Außerdem lässt sich so eine Zahl besser im gesamten Code ändern, da meistens andere Zahlen von ihr abhängen.

Ein Beispiel in Pseudocode, das 52 Zahlen in einem Array mischt:

for i from 1 to 52
j:= i + randomInt(53 - i) - 1
swapEntries(i, j)

Die Funktion randomInt(x) generiert eine Zahl zwischen 1 und x, und swapEntries(i, j) vertauscht die Einträge i und j im Array. 52 ist dabei eine magische Zahl. Besserer Stil ist das folgende Programm:

constant int deckSize:= 52
for i from 1 to deckSize
j:= i + randomInt(deckSize + 1 - i) - 1
swapEntries(i, j)

Die Vorteile daran sind:

  • Einfacher zu verstehen. Ein Programmierer, der das erste Programm liest, wird sich nach der Bedeutung der 52 fragen, und eventuell lange suchen, bevor er den Sinn dahinter erfasst.
  • Einfacher zu ändern. Wenn man im oberen Beispiel die magische Zahl ändern möchte, muss man weitere Zahlen ändern. In größeren Programmen wird dies extrem unübersichtlich. Es entstehen Fehler, die man später aufwendig suchen muss. Im Gegensatz dazu muss man im unteren Beispiel lediglich eine einzige Zeile ändern.
  • Sämtliche magische Zahlen befinden sich am Anfang des Programmes, so dass man den Überblick behält.
  • Es vereinfacht Parametrisierung. Soll also das obige Programm beliebig große Arrays mischen, kann man aus deckSize einfach einen Parameter machen. Beispiel:
function shuffle (int deckSize)
for i from 1 to deckSize
j:= i + randomInt(deckSize + 1 - i) - 1
swapEntries(i, j)
  • Tippfehler werden vermieden. Der Compiler wird kein Problem haben, wenn man statt 52 die Zahl 62 tippt, das Programm wird aber nicht ordnungsgemäß funktionieren. Tippt man dagegen dekSize, wird der der Fehler schon vom Compiler erkannt.

Nachteile sind:

  • Der Code wird verlängert. Wenn viele Konstanten in einer Zeile genutzt werden, müssen Zeilenumbrüche eingefügt werden.
  • Es erschwert das Debugging auf Systemen, auf denen die Werte von Konstanten nicht angezeigt werden.
  • Bei nicht sinnvoll eingeführten Konstanten muss der Leser ggf. einen weiteren Blick auf die Definition werfen.

Magische Zahlen in der Programmierung

Hexadezimalzahlen werden oft dazu benutzt, Werte auf Datenträgern bzw. anderem Speicher darzustellen. Die meisten Zahlen sehen dabei recht "uninteressant" und "zufällig aus". Manchmal ist es aber vorteilhaft, einen sofort auffallenden Wert zu haben (beispielsweise bei der Fehlersuche).

0xDEADBEEF (dezimal: 3.735.928.559) ist eine Zahl in hexadezimaler Notation, die als „dead beef“ (engl. Totes Rindfleisch) gelesen wird.

Normalerweise tritt ein Wert wie 0xDEADBEEF eher selten auf und wird somit dazu verwendet, besondere Werte anzuzeigen. Die Zahl an sich hat dabei keine spezielle Bedeutung und kann genauso durch andere Werte wie 0xABABABAB, 0x00C0FFEE oder 0xBAADF00D (engl. „bad food“, etwa „schlechtes Essen“) ersetzt werden.

Da ein solcher Wert selten vorkommt (mit einer Wahrscheinlichkeit von 1:2^32 = 1:4.294.967.296), wird er oft von Softwareentwicklern dazu benutzt, Fehler wie Pufferüberläufe oder uninitalisierte Variablen zu finden bzw. zu untersuchen. Wenn der Wert also im Speicher auftaucht, sollte der Programmierer sich diese Stelle genauer ansehen. Auch werden zu Debuggingzwecken Speicherbereiche, welche vom Programm nicht beschrieben werden sollten, mit 0xDEADBEEF vollgeschrieben. Schreibt das Programm in diesem Bereich, wird es sofort bemerkt.

Viele Versionen des PowerPC-Prozessors initialisieren ihre Register mit 0xDEADBEEF nach einem Hardware-Reset. 0xDEADBEEF wurde im originalen Mac-OS-Betriebssystem zu Diagnosezwecken benutzt, und sichtbarer auch bei den 1990 eingeführten RS/6000-Servern von IBM.

Siehe auch: Hexspeak, für die Transskription von Wörtern in hexadezimale Zahlen.

Referenzen


Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Magic Byte — Dieser Artikel oder Abschnitt bedarf einer Überarbeitung. Näheres ist auf der Diskussionsseite angegeben. Hilf mit, ihn zu verbessern, und entferne anschließend diese Markierung. Eine Magische Zahl (engl. magic number) ist in der Programmierung… …   Deutsch Wikipedia

  • Magic number — ██████████ …   Wikipédia en Français

  • Magic quotes — is a controversial feature of the PHP scripting language, which was introduced to help newcomers write functioning SQL commands without requiring manual escaping. It was later described and widely misinterpreted as help to prevent inexperienced… …   Wikipedia

  • Magic number (programming) — For other uses of the term, see Magic number (disambiguation). In computer programming, the term magic number has multiple meanings. It could refer to one or more of the following: A constant numerical or text value used to identify a file format …   Wikipedia

  • Magic Line — Die Shebang Zeichen – hash bang Bei unixoiden Betriebssystemen wird die Zeichenkombination #! am Anfang eines Skript Programms shebang oder auch Magic Line genannt. Die Markierung führt dazu, dass das folgende Kommando mitsamt aller angegeben… …   Deutsch Wikipedia

  • Magic word — Not to be confused with magical formula. For the use of magic words on Wikipedia, see Wikipedia:Magic words. The Sator Square Magic words are words which have a specific, and sometimes unintended, effect. They are often nonsense phrases used in …   Wikipedia

  • Magic satchel — is a term often used in reference to computer role playing games. It refers to the use of a character s inventory in the game, which can often contain more items (or items of too large a size) than is physically possible for the character to… …   Wikipedia

  • Heroes of Might and Magic — This article is about the series. For the first game, see Heroes of Might and Magic: A Strategic Quest. Heroes of Might and Magic Current logo for the Heroes of Might and Magic series Genres Turn based strategy …   Wikipedia

  • Ubisoft Blue Byte — Тип дочернее общество Год основания 1988 Прежние названия Blue Byte GmbH Расположение …   Википедия

  • Shebang (Unix) — In computing, a shebang (also called a hashbang, hashpling, or pound bang) refers to the characters #! when they are the first two characters in a script file. Unix like operating systems take the presence of these two characters as an indication …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”