Clustal

Clustal
Clustal
Entwickler Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD)
Aktuelle Version 2.1
(17. November 2010)
Betriebssystem Unix, Linux, Mac OS X, Microsoft Windows
Kategorie Bioinformatik-Tool
Lizenz Seit Version 2.1 LGPL, davor für akademische Benutzer kostenlos
www.clustal.org

Clustal ist ein weitverbreitetes Computerprogramm für Multiples Sequenzalignment. Die aktuelle Version ist 2.1. Es gibt zwei Varianten des Programms:

Inhaltsverzeichnis

Eingabe / Ausgabe

Das Programm kann eine große Auswahl Eingabeformate verarbeiten, darunter NBRF/PIR, FASTA, EMBL/Swissprot bzw. UniProt, Clustal, GCC/MSF, GCG9 RSF und GDE.

Die Ausgabe kann in folgenden Formaten erfolgen: Clustal, NBRF/PIR, GCG/MSF, PHYLIP, GDE, NEXUS.

Multiples Sequenzalignment

Clustal führt drei Hauptschritte durch:

  1. Paarweises Alignment,
  2. einen Phylogenetischen Baum erstellen (oder einen benutzerdefinierten verwenden),
  3. den phylogenetischen Baum für das multiple Alignment verwenden.

Diese Schritte werden automatisch durchgeführt, wenn man Do Complete Alignment (Komplettes Alignment durchführen) auswählt. Als weitere Optionen stehen Do Alignment from guide tree (Führe Alignment anhand eines Guide tree) und Produce guide tree only (Nur den Guide Tree erstellen).

Profil Alignments

Paarweise Alignments werden für alle und gegen alle Sequenzen berechnet; Übereinstimmungen werden in einer Matrix gespeichert. Diese wird anschließend in eine Distanzmatrix (distance matrix) konvertiert, wo der Distanzwert den evolutionären Abstand zwischen jedem Sequenzpaar widerspiegelt.

Aus dieser Distanzmatrix wird anhand eines Neighbor-Joining-Algorithmus zur Clusterbildung (Neighbor-joining clustering algorithm) ein Guide Tree oder ein phylogenetischer Baum konstruiert, der die Reihenfolge vorgibt, in der Sequenzpaare aligniert (angeordnet) und mit vorangegangenen Alignments kombiniert werden sollen. Sequenzen werden an jedem Zweigpunkt progressiv aligniert, wobei mit demjenigen Sequenzpaar begonnen wird, dass den geringsten Abstand aufweist.

Einstellungen

Benutzer können unter Verwendung der Standardeinstellung Sequenzen alignieren, aber von Fall zu Fall ist es sinnvoll, eigene Parameter zu verwenden.

Die Hauptparameter sind gap opening penalty und die gap extension penalty (siehe Sequenzalignment).

Beschleunigte Version

Eine FPGA-basierte Version des ClustalW Algorithmus wird von der Firma Progeniq angeboten und verzeichnet eine zwanzigfach höhere Verarbeitungsgeschwindigkeit gegenüber der Software-Implementierung.

Quellen

  • J. D. Thompson et al. (1997): The ClustalX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. In: Nucleic Acids Research. Bd. 25, S. 4876-4882. PMID 9396791
  • R. Chenna et al. (2003): Multiple sequence alignment with the Clustal series of programs. In: Nucleic Acid Research. Bd. 31, S. 3497-3500. PMID 12824352
  • M. A. Larkin et al. (2007): Clustal W and Clustal X version 2.0. In: Bioinformatics. Bd. 23, S. 2947-2948. PMID 17846036

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Clustal W — Clustal Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version: 2.10 (14. Oktober 2008) Betriebssystem …   Deutsch Wikipedia

  • Clustal — Desarrollador Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (University College Dublin) Clustal Información general Última versión estable 2.1 1 …   Wikipedia Español

  • Clustal — Developer(s) Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Stable release 2.1 / 17 November 2010; 11 months ago (2010 11 17) Written in C++ …   Wikipedia

  • Clustal — Omega Тип Биоинформатика Разработчик Des Higgins, Fabian Sievers, David Dineen и Andreas Wilm (Conway Institute, UCD) Написана на C++ Операционная система UNIX, Linux, Mac, Windows Последняя версия 1.1.0 ( …   Википедия

  • ClustalW — Clustal Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version: 2.10 (14. Oktober 2008) Betriebssystem …   Deutsch Wikipedia

  • ClustalX — Clustal Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version: 2.10 (14. Oktober 2008) Betriebssystem …   Deutsch Wikipedia

  • Multiple sequence alignment — A multiple sequence alignment (MSA) is a sequence alignment of three or more biological sequences, generally protein, DNA, or RNA. In many cases, the input set of query sequences are assumed to have an evolutionary relationship by which they… …   Wikipedia

  • Alineamiento múltiple de secuencias — Un alineamiento múltiple de secuencias (MSA, por sus siglas en inglés) es un alineamiento de tres o más secuencias biológicas, generalmente proteínas, ADN o ARN. En general, se asume que el conjunto de secuencias de consulta que se ingresa como… …   Wikipedia Español

  • Alineamiento de secuencias — Un alineamiento de secuencias en bioinformática es una forma de representar y comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras primarias proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones funcionales… …   Wikipedia Español

  • Sequence alignment — In bioinformatics, a sequence alignment is a way of arranging the sequences of DNA, RNA, or protein to identify regions of similarity that may be a consequence of functional, structural, or evolutionary relationships between the sequences.[1]… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”