Assembler (Informatik)

Ein Assembler (nach DIN 44300: Assemblierer) ist ein Hilfsprogramm der Programmierung (Programmierwerkzeug), das ein in maschinennaher Assemblersprache geschriebenes Computerprogramm in Maschinensprache (auch Maschinencode oder Nativer Code genannt) übersetzt. Assembler wird häufig auch als Synonym für Assemblersprache benutzt. Der erste Assembler wurde von Nathaniel Rochester für eine IBM 701 geschrieben.

Inhaltsverzeichnis

Beschreibung

Immer mehr an maschinennaher Programmierung – die Domäne von Assemblersprache – kann heute fast vollständig durch höhere Programmiersprachen abgedeckt werden. Auch steht der Möglichkeit der Erstellung effizienter Programme die erschwerte Wartbarkeit von Assemblerprogrammen gegenüber. Für optimalen Code wird immer mehr Kontextwissen benötigt (zum Beispiel: Cachenutzung, Lokalität, temporale Nutzung etc.). Ein Beispiel hierfür wäre der SSE-Befehl movntq, welcher wegen fehlenden Kontextwissens nicht oder nur sehr spekulativ von Compilern eingesetzt werden kann.

Auf der anderen Seite benutzen die meisten Compiler für höhere Programmiersprachen nur einen kleinen Teil des Befehlssatzes der CPU (ein Sachverhalt, der zur Entwicklung von RISC-Prozessoren geführt hat), während dem Assemblerprogrammierer der vollständige Befehlssatz zur Verfügung steht, sodass er in manchen Situationen effizientere Befehle benutzen kann, die dem reinen Hochsprachenprogrammierer nicht zugänglich sind. Einige Programmiersysteme für höhere Programmiersprachen gestatten es, Assemblersprachenbefehle mittels Inline-Assembler in den Quelltext zu integrieren. Die Anwendung kann sich dann auf die Situationen beschränken, in denen es aus funktionalen oder Effizienzgründen notwendig oder nützlich ist, maschinennah zu programmieren.

Zu beachten ist, dass verschiedene Prozessorarchitekturen grundverschiedene Assembler- und Maschinensprachen haben, so dass jeweils ein zur aktuellen Architektur passender Assembler benötigt wird und die Programme nicht oder nur unter großen Einschränkungen portabel sind.

Makroassembler gestatten die Bildung von parametrisierbaren Anweisungen. Eine Makroanweisung wird im Allgemeinen in mehr als einen Maschinenbefehl umgesetzt.

Abgrenzung zu Hochsprachencompilern

Assembler sind immer spezifisch auf einen oder wenige Prozessortypen ausgerichtet. Assembler und Assemblersprache für die IA32-Architektur unterscheiden sich beispielsweise vollständig von dem für die MIPS-Architektur.

Manche Hochsprachencompiler übersetzen ein Programm zuerst in Assemblersprache und rufen dann einen Assembler zur Erzeugung von Maschinensprache auf. Während sich Hochsprachen eher an der menschlichen Sprache orientieren und somit verhältnismäßig leicht verständlich sind, orientiert sich Assemblersprache eng an der Maschine. In Assemblersprache werden die Opcodes (Befehle) der jeweiligen CPU mit Namen, den sogenannten Mnemonics, versehen und bilden damit ein direktes Abbild des Befehlssatzes der CPU. Während man sich in einer Hochsprache kaum oder überhaupt nicht um die darunterliegende CPU kümmern muss, so ist das Verständnis dieser bei Assembler die Voraussetzung.

Spezialformen

Crossassembler

Ein Cross-Assembler ist eine Spezialform des Assemblers, der auf einer Computerplattform H (Host) läuft und Maschinencode für eine andere Computerplattform T (Target) erzeugt. Er ist damit ein spezieller Cross-Compiler.

Cross-Assembler kommen heute vor allem bei der Entwicklung eingebetteter Systeme zum Einsatz, um schnellen und kompakten Code für Mikrocontroller und DSPs zu erstellen.

Ein Beispiel ist der Cross-Assembler ASEM-51, der auf den Hostplattformen MS-DOS, Windows und Linux läuft. Er erzeugt Code für die Mikrocontrollerfamilie MCS-51 von Intel (Zielplattform).

Disassembler

Hauptartikel: Disassembler.

Ein Programm zum Rückübersetzen von Maschinensprache in Assemblersprache wird als Disassembler bezeichnet. Diese Rückübersetzung ist möglich, da es – anders als bei Hochsprachen – eine Eins-zu-Eins-Beziehung zwischen einfacher Assemblersprache und Maschinensprache gibt. Dabei können jedoch Bezeichner und Kommentare nicht wiederhergestellt werden, da diese durch die Assemblierung verloren gehen. Meist werden Assemblersprachen um Makrofunktionalitäten ergänzt, so dass diese direkte Abbildung nur noch teilweise möglich ist.

Maschinensprachemonitor

Auf einigen Plattformen existiert eine sehr einfache Version eines Assemblers, kombiniert mit der Möglichkeit, Programme interaktiv zu testen und zu analysieren, die Maschinensprachemonitor genannt wird.

Hersteller und Produkte

Für die x86-Prozessoren-Familie und kompatible Prozessoren (zum Beispiel Intels Pentium oder AMDs Athlon) sind der Microsoft Macro Assembler (MASM), der Borland Turbo Assembler (TASM) und der Netwide Assembler (NASM) weit verbreitet. Auch der Flat Assembler (FASM) bietet viele Features, die ein moderner Assembler benötigt. Yasm schließlich ist ein Rewrite von NASM unter BSD-Lizenz. Neben Assemblern, die die Intel-Syntax kennen, gibt es noch solche, die Assemblercode in der AT&T-Syntax assemblieren können, wie den unter Linux hauptsächlich genutzten GNU Assembler (GAS). GAS unterstützt seit Version 2.10 über die .intel_syntax Direktive auch die Intel-Syntax.[1][2][3]

Auf IBM-Großrechnern (System z) wird der High Level Assembler verwendet, Hercules-Anwender müssen entweder den veralteten Assembler Assembler-F benutzen oder aber den Tachyon Legacy Assembler verwenden, welcher unter Linux für z/Series läuft.

Für die Mikrocontrollerfamilie MCS-51 von Intel, deren erster Vertreter der 8051 war, gibt es den freien Macroassembler ASEM-51. Heute gibt es bereits hunderte von 8051-Derivaten von über 50 Halbleiterherstellern.

Siehe auch

Referenzen

  1. Ram Narayam (17. Oktober 2007): Linux assemblers: A comparison of GAS and NASM. Abgerufen am 2. Juli 2008.
  2. Randall Hyde: Which Assembler is the Best?. Abgerufen am 18. Mai 2008.
  3. GNU Assembler News, v2.1 supports Intel syntax (4. April 2008). Abgerufen am 2. Juli 2008.

Weblinks

Wikibooks Wikibooks: Assembler – Lern- und Lehrmaterialien

Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Assembler — steht für: Assembler (Informatik), ein Computerprogramm, das eine Assemblersprache in Maschinensprache übersetzt Assembler (Bioinformatik), ein Computerprogramm, das eine Genomassemblierung durchführt Assembler (Nanotechnologie), ein Roboter, der …   Deutsch Wikipedia

  • Assembler-Code — Eine Assemblersprache ist eine spezielle Programmiersprache, welche die Maschinensprache einer spezifischen Prozessorarchitektur in einer für den Menschen lesbaren Form repräsentiert. Jede Computerarchitektur hat folglich ihre eigene… …   Deutsch Wikipedia

  • Netwide Assembler — NASM NASM 2.00 Basisdaten Aktuelle Version: 2.05.01 (29. Oktober 2008) Aktuelle Vorabversion: 2.06rc2 (19. Dezember 2008) …   Deutsch Wikipedia

  • Microsoft Assembler — Der Microsoft Macro Assembler (abgekürzt MASM) ist ein von Microsoft entwickelter Assembler für x86 basierende Prozessoren. Er übersetzt Assemblerquelltext in ausführbaren, nativen Maschinencode. Der Microsoft Macro Assembler entwickelte sich… …   Deutsch Wikipedia

  • Inline-Assembler — Ein Inline Assembler oder integrierter Assembler ist ein Assembler, der in den Compiler einer höheren Programmiersprache integriert ist. Mittels einer speziellen Anweisung ist hierbei Assembler Quelltext direkt in die höhere Programmiersprache… …   Deutsch Wikipedia

  • Intel Assembler Syntax — ASM86 wurde von der Firma Intel als Assembler für deren x86 Prozessor Familie vertrieben. Heute wird er nicht mehr vertrieben oder weiterentwickelt. Seine Syntax ist jedoch weit verbreitet unter x86 Assemblern wie der Netwide Assembler, Microsoft …   Deutsch Wikipedia

  • Kommentar (Informatik) — Kommentare sind Annotationen innerhalb von Programmiersprachen und Textbeschreibungssprachen. Alle diese Sprachen bestehen aus Anweisungen für den Computer (Code) und Hinweisen für Textbearbeiter (Kommentaren). Wird ein Quelltext… …   Deutsch Wikipedia

  • Cross-Assembler — Ein Assembler (nach DIN 44300: Assemblierer) ist ein Hilfsprogramm der Programmierung (Programmierwerkzeug), das ein in einer einfachen, maschinennahen Assemblersprache geschriebenes Programm in Maschinensprache (auch Maschinencode oder Nativer… …   Deutsch Wikipedia

  • Faden (Informatik) — Ein Thread (auch: Aktivitätsträger oder leichtgewichtiger Prozess, vereinzelt auch: Faden) bezeichnet in der Informatik einen Ausführungsstrang oder eine Ausführungsreihenfolge in der Abarbeitung eines Programms. Ein Thread ist Teil eines… …   Deutsch Wikipedia

  • Pointer (Informatik) — Mit Zeiger oder Pointer wird in der Informatik eine spezielle Variable bezeichnet, die auf eine andere Variable oder Funktion verweist. Der referenzierte Speicherbereich enthält entweder Daten (Objekt, Variable) oder Programmcode. Zeiger auf… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”