Codon


Codon
Genetische Code-Sonne: Die Kodierung der Aminosäuren (außen) durch die Basentripletts auf der mRNA ist von innen (5') nach außen (3') zu lesen.

Der genetische Code ist eine Regel, nach der in Nukleinsäuren befindliche Dreiergruppen aufeinanderfolgender NukleobasenTripletts oder Codons genannt – in Aminosäuren übersetzt werden. Diese Übersetzung, Translation genannt, findet bei der Bindung von Aminosäuren an verschiedene Transfer-Ribonukleinsäuren (tRNA) statt, durch die die Aminosäuren für ihren Zusammenbau zu Proteinen angeordnet bzw. aktiviert werden.

Die Transfer-Ribonukleinsäuren unterscheiden sich durch ihr an einer prominenten Molekülstelle befindliches Nukleotid-Triplett, das aus jeweils drei Nukleotiden besteht, die den Nukleotiden eines bestimmten Codons entsprechen (komplementär sind), also ein dreigliedriges Anticodon bilden. Codon und Anticodon passen spezifisch zueinander und ihnen ist nach dem genetischen Code eine bestimmte Aminosäure zugeordnet. An jede Transfer-Ribonukleinsäure wird diejenige Aminosäure gebunden, für die das zum Anticodon der tRNA passende Codon steht. Auf diese Weise, durch die spezifische Bindung einer Aminosäure an eine tRNA mit einem dafür vom genetischen Code vorgesehenen Anticodon, wird also das Zeichen für eine bestimmte Aminosäure, das Codon, in die nach dem genetischen Code vorgeschriebene Aminosäure übersetzt. Streng genommen ist also die Translation schon in der Struktur der verschiedenen tRNA-Arten enthalten: Jedes tRNA-Molekül enthält eine so strukturierte Aminosäure-Bindungsstelle, dass nur die nach dem genetischen Code zu dem Anticodon dieser tRNA passende Aminosäure daran gebunden werden kann.

Nach Bindung der Aminosäuren an tRNA kann die Synthese des durch die Folge der Codons in einer Desoxyribonukleinsäure (DNA) festgelegten Proteins beginnen. Als Voraussetzung für diese Synthese wird der DNA-Abschnitt eines Gens zunächst in ein Messenger-Ribonukleinsäure (mRNA) umgeschrieben (Transkription); danach werden in Eukaryoten bestimmte Teile dieser mRNA gezielt entfernt (Spleißen). Schließlich werden die Aminosäuren der zu den Codons passenden tRNAs miteinander zu einer Polypeptidkette verknüpft.

Alle nach der Synthese und dem Spleißen der mRNA folgenden Schritte bis einschließlich der Synthese der Proteine werden als Translation bezeichnet, da bei der Proteinsynthese die Umsetzung der Triplett-Folge der DNA in eine Aminosäure-Folge deutlich wird. Die eigentliche Anwendung des genetischen Codes, die Übersetzung eines Codons, in eine Aminosäure findet jedoch nur bei der Bindung der Aminosäuren an tRNA statt, also bei der Vorbereitung der Aminosäuren zum Zusammenbau der Proteine. Einige Basentripletts codieren für keine Aminosäure. Diese werden auch als Nonsens-Codons bezeichnet. Sie führen zu einem Translations-Stop, welcher die Proteinsynthese beendet (Stopcodons).

Alle Lebewesen benutzen in Grundzügen denselben genetischen Code. Die gebräuchlichste Version ist in den folgenden Tabellen angegeben. Sie zeigen, welche Aminosäuren von den 43 = 64 möglichen Codons kodiert werden (Tabelle 1), und welche Codons jede der 20 in der Translation verwendeten Aminosäuren kodieren (Tabelle 2). So steht zum Beispiel GAU für die Aminosäure Asp (Asparaginsäure), und Cys (Cystein) wird von den Codons UGU und UGC kodiert. Die in der Tabelle verwendeten Basen sind Adenin, Guanin, Cytosin und Uracil der mRNA; in der DNA wird statt Uracil Thymin verwendet.

Inhaltsverzeichnis

Geschichte der Entdeckung

Das Rennen um das Verständnis des genetischen Codes fesselte die Biochemiker die erste Hälfte der sechziger Jahre des vorigen Jahrhunderts. Am 27. Mai 1961 um 3 Uhr morgens gelang dem deutschen Biochemiker Heinrich Matthaei, im Labor von Marshall Nirenberg, mit dem Poly-U-Experiment der entscheidende Durchbruch: die Entschlüsselung des Codons UUU für die Aminosäure Phenylalanin. Dieses Experiment wird von einigen Genetikern als das bedeutendste des 20. Jahrhunderts bezeichnet. 1966, nur fünf Jahre nach der Entzifferung des ersten Codons, war die vollständige Entschlüsselung des genetischen Codes mit allen 64 Basentripletts gelungen.

Codon

Als Codon bezeichnet man die Abfolge einer Sequenz von drei Nukleobasen (Basentriplett) der mRNA, die im genetischen Code für eine Aminosäure codiert. Insgesamt existieren 43 = 64 mögliche Codons, davon sind drei Nonsens-Codons, diese werden zur Termination der Translation genutzt, die restlichen 61 codieren für die insgesamt 20 proteinogenen Aminosäuren. Für viele Aminosäuren gibt es daher mehrere verschiedene Kodierungen. Die Kodierung als Triplett ist trotzdem notwendig, da bei einer Duplett-Kodierung nur 42 = 16 mögliche Codons entstehen würden, und somit nicht genügend Möglichkeiten vorhanden wären, um alle 20 Aminosäuren abzudecken.

Standard-Codon-Tabelle. Diese Tabelle zeigt die 64 möglichen Basen-Tripletts.
2. Base
U C A G
1. Base U
UUU Phenylalanin
UUC Phenylalanin
UUA Leucin
UUG Leucin
UCU Serin
UCC Serin
UCA Serin
UCG Serin
UAU Tyrosin
UAC Tyrosin
UAA Stop
UAG Stop
UGU Cystein
UGC Cystein
UGA Stop
UGG Tryptophan
C
CUU Leucin
CUC Leucin
CUA Leucin
CUG Leucin
CCU Prolin
CCC Prolin
CCA Prolin
CCG Prolin
CAU Histidin
CAC Histidin
CAA Glutamin
CAG Glutamin
CGU Arginin
CGC Arginin
CGA Arginin
CGG Arginin
A
AUU Isoleucin
AUC Isoleucin
AUA Isoleucin
AUG Methionin*
ACU Threonin
ACC Threonin
ACA Threonin
ACG Threonin
AAU Asparagin
AAC Asparagin
AAA Lysin
AAG Lysin
AGU Serin
AGC Serin
AGA Arginin
AGG Arginin
G
GUU Valin
GUC Valin
GUA Valin
GUG Valin
GCU Alanin
GCC Alanin
GCA Alanin
GCG Alanin
GAU Asparaginsäure
GAC Asparaginsäure
GAA Glutaminsäure
GAG Glutaminsäure
GGU Glycin
GGC Glycin
GGA Glycin
GGG Glycin
* Das Triplett AUG dient sowohl als Codon für Methionin als auch als Startsignal der Translation, es wird daher auch als Startcodon bezeichnet. Eines der ersten AUG-Tripletts auf der mRNA wird das erste Codon, das zu Protein translatiert wird. Welches AUG genau verwendet werden soll, erkennen die Proteine an Signalen in der umliegenden Sequenz.
Farbgebung der Aminosäuren
hydrophob (unpolar)
hydrophil neutral (polar)
hydrophil und positiv aufladbar (basisch)
hydrophil und negativ aufladbar (sauer)
Umgekehrte Codon-Tabelle.
Az AS Codon
1 Met AUG
1 Trp UGG
2 Tyr UAU UAC
2 Phe UUU UUC
2 Cys UGU UGC
2 Asn AAU AAC
2 Asp GAU GAC
2 Gln CAA CAG
2 Glu GAA GAG
2 His CAU CAC
2 Lys AAA AAG
3 Ile AUU AUC AUA
4 Gly GGU GGC GGA GGG
4 Ala GCU GCC GCA GCG
4 Val GUU GUC GUA GUG
4 Thr ACU ACC ACA ACG
4 Pro CCU CCC CCA CCG
6 Leu CUU CUC CUA CUG UUA UUG
6 Ser UCU UCC UCA UCG AGU AGC
6 Arg CGU CGC CGA CGG AGA AGG
3 STOP UAA UAG UGA

Die Translation beginnt mit einem START-Codon, aber dies alleine ist nicht ausreichend, um den Prozess zu beginnen. Bestimmte Initiationssequenzen nahe dem START-Codon sind ebenfalls notwendig, um die Transkription in mRNA und deren Bindung am Ribosom herbeizuführen. Das wichtigste START-codon ist AUG, das auch für Methionin codiert. CUG und UUG, sowie GUG und AUU in Prokaryoten, funktionieren ebenfalls, allerdings mit wesentlich geringerer Effizienz. Die erste Aminosäure ist aber immer Methionin.

Die Translation endet mit einem der drei STOP-Codons, die auch Nonsens-Codons genannt werden. Ursprünglich wurden diesen Codons Namen gegeben – UAG ist amber (bernsteinfarben), UGA ist opal (opalfarben), und UAA ist ochre (ockerfarben), ein Wortspiel auf den Namen ihres Entdeckers (Harris Bernstein).

Während das Codon UGA zumeist als STOP gelesen wird, kann es selten und nur unter bestimmten Bedingungen für eine 21. Aminosäure stehen: Das Selenocystein (Sec). Die Biosynthese und der Einbaumechanismus von Selenocystein in Proteine unterscheidet sich stark von dem aller anderen Aminosäuren: seine Insertion erfordert einen neuartigen Translationsschritt, bei dem ein UGA im Rahmen einer bestimmten Sequenzumgebung und zusammen mit bestimmten Cofaktoren anders interpretiert wird. Hierzu ist eine strukturell einzigartige, Selenocystein spezifische tRNA (tRNASec) erforderlich, die bei Vertebraten mit drei verschiedenen, allerdings verwandten Aminosäuren beladen werden kann: Serin, Selenocystein und Phosphoserin.

Degeneration und Fehlertoleranz

Wird während der Translation ein Codon falsch dekodiert (eine falsche Aminosäure verwendet), so stimmt die Struktur des hergestellten Eiweißes nicht mehr, und es funktioniert nicht mehr wie vorgesehen. Offenbar war es daher sehr früh in der Evolutionsgeschichte notwendig, den genetischen Code mit einer gewissen Fehlertoleranz auszustatten: Er ist ein so genannter degenerierter Code, das heißt, dass eine semantische Einheit durch mehrere unterschiedliche syntaktische Symbole codiert wird: Abzüglich der Stop-Codons stehen ja 61 unterschiedliche Codons zu Verfügung, es müssen aber nur 20 Aminosäuren codiert werden. Wie in der Tabelle oben ersichtlich, werden also für manche Aminosäuren mehrere Codes verwendet. Diese unterscheiden sich dann in der Regel in nur einer der drei Basen. (Sie haben dadurch einen minimalen Abstand im Coderaum (siehe: Hammingdistanz). Wird also eine der Basen falsch gelesen, liegt die Wahrscheinlichkeit, dass trotzdem die richtige Aminosäure ausgewählt wird, noch immer bei 60 %. Meist unterscheiden sich die betroffenen Codons zudem in der dritten ("wobble") Base eines Codons, die bei der Translation am häufigsten falsch gelesen wird.

Darüber hinaus haben Aminosäuren, die häufiger in Proteinen vorkommen als andere, mehr Codons, die für sie kodieren.

Bemerkenswert ist die Tatsache, dass der Charakter einer Aminosäure weitgehend durch die mittlere Position eines Tripletts bestimmt wird:

  • U (RNA) / T (DNA) – hydrophob
  • C – polar bis neutral
  • A – geladen
  • G – geladen, neutral bis polar

Daraus folgt, dass Radikalsubstitutionen (Tausch gegen Aminosäuren eines anderen Charakters) in erster Linie Folge von Mutationen in dieser zweiten Position sind. Mutationen in der ersten, besonders aber in der dritten Position ("wobble") erhalten dagegen häufig die Aminosäure oder zumindest ihren Charakter "konservative Substitution". Berücksichtigt man ferner, dass Transitionen (Umwandlung von Purinen bzw. Pyrimidinen ineinander) aus mechanistischen Gründen häufiger auftreten als Transversionen (Umwandlung eines Purins in ein Pyrimidin und umgekehrt; dieser Prozess setzt zumeist eine Depurinierung voraus), so ergibt sich eine weitere Erklärung für den konservativen Charakter des Codes.

Ursprung des genetischen Codes

Früher glaubte man, der genetische Code sei zufällig entstanden. Noch 1968 bezeichnete Francis Crick ihn als „eingefrorenen Zufall“. Untersuchungen aus dem Jahr 2004 deuten jedoch darauf hin, dass er das Resultat einer strengen Optimierung hinsichtlich der Fehlertoleranz darstellt. Fehler sind besonders gravierend für die räumliche Struktur eines Proteins, wenn sich die Hydrophobie einer fälschlich eingebauten Aminosäure deutlich vom Original unterscheidet. Im Rahmen einer statistischen Analyse erweisen sich in dieser Hinsicht unter 1 Million Zufallscodes nur 100 besser als der tatsächliche. Berücksichtigt man bei der Berechnung der Fehlertoleranz zusätzliche Faktoren, die typischen Mustern von Mutationen und Lesefehlern entsprechen, so reduziert sich diese Zahl sogar auf 1 von 1 Million.[1]

Universalität des Codes

Grundprinzip

Bemerkenswert ist, dass der genetische Code im Prinzip für alle Lebewesen gleich ist, alle Lebewesen sich also der gleichen „genetischen Sprache“ bedienen. Da also ein bestimmtes Codon immer für die gleiche Aminosäure steht ist es möglich, in der Gentechnik z.B. das Gen für menschliches Insulin in Bakterien einzuschleusen, damit diese Insulin produzieren. Dieses Prinzip wird als „Universalität des Codes“ bezeichnet. Dies erklärt sich aus der Evolution so, dass der genetische Code schon sehr früh in der Entwicklungsgeschichte des Lebens ausgestaltet und an alle sich entwickelnden Arten weitergegeben wurde. Eine solche Generalisierung schließt nicht aus, dass die Häufigkeit verschiedener Codewörter (das so genannte Codon Usage) sich zwischen den Organismen unterscheiden kann.

Ausnahmen

Es gibt auch offensichtliche Ausnahmen von der Universalität des genetischen Codes: So wird in den Mitochondrien, energieumsetzenden Organellen, die vermutlich von symbiotischen Bakterien abstammen (Endosymbionten-Theorie), und die eine eigene Erbsubstanz (neben der DNA des Zellkerns) tragen, eine leicht abgewandelte Form des Codes benutzt.

Auch die Ciliaten zeigen Abweichungen vom Standard-Code: UAG, und häufig auch UAA, kodieren für Glutamin; diese Abweichung findet sich auch in einigen Grünalgen. UGA steht auch manchmal für Cystein. Eine weitere Variante findet sich in der Hefe Candida, wo CUG Serin kodiert.

Des weiteren gibt es einige Varianten von Aminosäuren, die von Bakterien (Bacteria) und Archaeen (Archaea) verwendet werden; das STOP-codon UGA kann, wie oben beschrieben, Selenocystein und UAG Pyrrolysin kodieren. Es ist nicht auszuschließen, dass weitere Kodierungs-Varianten existieren, die bislang noch nicht entdeckt wurden.

Zurzeit sind 16 Abweichungen der Zuordnung einer Aminosäure zu einem Codon (Basentriplett der mRNA) vom Standard-Code bekannt:

Abweichungen vom Standard-Code
Vorkommen Codon Standard Abweichung
Einige Arten der Pilzgattung Candida CUG Leucin Serin
Mitochondrien z. B. bei Saccharomyces cerevisiae CU(U, C, A, G) Leucin Threonin
Mitochondrien Höherer Pflanzen CGG Arginin Tryptophan
Mitochondrien (bei allen bis jetzt untersuchten Organismen) UGA Stop Trp
Mitochondrien von Säugern, Drosophila und S. cerevisiae und Protozoen AUA Ile Methionin = Start
Bakterien GUG Valin Start
Eukarya (selten) CUG Leucin Start
Eukarya (selten) GUG Valin Start
Bacteria GUG Valin Start
Bacteria (selten) UUG Leucin Start
Eukarya (selten) ACG Threonin Start
Mitochondrien von Säugern AGC, AGU Serin Stop
Mitochondrien von Drosophila AGA Arginin Stop
Mitochondrien von Säugern AG(A, G) Arginin Stop

Siehe auch

Einzelnachweise

  1. S. J. Freeland, L. D. Hurst, Der raffinierte Code des Lebens. In: Spektrum der Wissenschaft, Juli 2004, S.86–93.

Literatur

  • Lily E. Kay, Who wrote the book of life? : A history of the genetic code, Stanford, Calif. : Stanford Univ. Press, 2000, dt. Das Buch des Lebens. Wer schrieb den genetischen Code?, Frankfurt am Main: Suhrkamp 2005, ISBN 351829346X
  • Vaas, Rüdiger: Der genetische Code. Evolution und selbstorganisierte Optimierung, Abweichungen und gezielte Veränderung. Wissenschaftliche Verlagsgesellschaft: Stuttgart 1994, ISBN 3804713831
  • Lei Wang, Peter G. Schultz: Die Erweiterung des genetischen Codes. Angewandte Chemie 117(1), S. 34 - 68 (2005), ISSN 0044-8249
  • Guenther Witzany: Natural Genome Editing Competences of Viruses. In: Acta Biotheoretica. 54 S. 235-253. doi:10.1007/s10441-007-9000-7

Weblinks


Wikimedia Foundation.

Schlagen Sie auch in anderen Wörterbüchern nach:

  • codon — [ kɔdɔ̃ ] n. m. • 1968; de code (génétique) ♦ Biochim. Dans un acide nucléique, Triplet de nucléotides désigné par les initiales des noms des trois bases respectives, et dont l ordre séquentiel constitue l information qui commande et spécifie la… …   Encyclopédie Universelle

  • codon — CODÓN s. m. secvenţă de trei nucleotide ale macromoleculei de acid dezoxiribonucleic care codifică un aminoacid specific. (< fr., engl. codon) Trimis de raduborza, 15.09.2007. Sursa: MDN …   Dicționar Român

  • códon — s. m. [Genética] Sequência de três nucleotídeos que constitui uma unidade genética. • [Brasil] Plural: códones ou códons.   ‣ Etimologia: inglês codon   • Confrontar: códão.   ♦ Grafia em Portugal: codão …   Dicionário da Língua Portuguesa

  • Codon — Co don (k[=o] d[o^]n), n. (Molecular biology) a sequence of three nucleotides in a genome or a DNA or messenger RNA molecule, which specifies the incorporation of one amino acid or is a stop signal, during the biosynthesis of proteins. Codons… …   The Collaborative International Dictionary of English

  • codon — codon. См. триплет. (Источник: «Англо русский толковый словарь генетических терминов». Арефьев В.А., Лисовенко Л.А., Москва: Изд во ВНИРО, 1995 г.) …   Молекулярная биология и генетика. Толковый словарь.

  • Codon — (C. L.), Pflanzengattung aus der Familie der Hydroleaceae, Übergangsgattung zu den Solanaceen, 10. Kl. 1. Ordn. L. Art: C. Royeni, Pflanze vom Cap …   Pierer's Universal-Lexikon

  • codón — Unidad de tres nucleótidos adyacentes en una molécula de ADN o de ARN mensajero que determina un aminoácido específico en la cadena polipeptídica durante la síntesis de proteínas. Diccionario Mosby Medicina, Enfermería y Ciencias de la Salud,… …   Diccionario médico

  • Codon — Codon, komplementär zu einem ⇒ Codogen der DNA an der mRNA in der Transkription gebildetes ⇒ Basentriplett. Manchmal bezeichnet man auch die DNA Tripletts als C …   Deutsch wörterbuch der biologie

  • CODON — Graece Κώδων, proprie cymbalum est, vel parva potius ex aere nola. Hinc et tubarum orificia, qua spiritus emittitur, quod eam referant formam, sensimque sese in exitu dilatantia repandis per ambitum labris aperiantur. Codones quoque appellati:… …   Hofmann J. Lexicon universale

  • codon — 1962, from CODE (Cf. code) + ON (Cf. on) …   Etymology dictionary

  • codon —  Codon  (Triplet, Coding Triplet)  Кодоны (триплет, кодирующий тринуклеотид)   Последовательность из трех соседних нуклеотидов в ДНК или РНК, кодирующая определенную аминокислоту, либо начало (тогда он называется старт кодоном, инициирующим… …   Толковый англо-русский словарь по нанотехнологии. - М.