TRANSFAC

TRANSFAC

TRANSFAC (TRANScription FACtor database) ist eine manuell kuratierte Datenbank über eukaryote Transkriptionsfaktoren, deren genomische Bindungsstellen und DNA-Bindungsprofile. Die Inhalte der Datenbank können mithilfe entsprechender Software zur Vorhersage potentieller Transkriptionsfaktor-Bindungsstellen (TFBS) verwendet werden.

Inhaltsverzeichnis

Geschichte

Die der Datenbank zugrunde liegende Datensammlung wurde erstmals 1988 von Edgar Wingender veröffentlicht. Sie umfasste im Wesentlichen drei Tabellen: über Transkriptionsfaktor-Bindungsstellen (TFBS) in Genen, über Transkriptionsfaktoren (TF) und über DNA-Bindungsdomänen vom Zinkfinger-Typ.[1] Daraus wurde zunächst eine lokal lauffähige Datenbank mit dem Namen TRANSFAC erstellt.[2] Im Rahmen eines der ersten öffentlich geförderten Bioinformatikprojekte in Deutschland an der damaligen Gesellschaft für Biotechnologische Forschung (GBF, dem heutigen Helmholtz-Zentrum für Infektionsforschung, HZI) in Braunschweig wurde daraus eine über das Internet verfügbare Ressource entwickelt.[3] Zur Sicherung einer langfristigen Finanzierung erfolgte 1997 die Übertragung der Datenbank an ein dazu gegründetes Unternehmen (BIOBASE GmbH). Es gibt aber weiterhin ältere, für nicht-kommerzielle Nutzer frei zugängliche Versionen der Datenbank.[4][5]

Inhalte und Struktur der Datenbank

Grundstruktur der TRANSFAC-Datenbank mit den Primärdaten über Transkriptionsfaktoren (FACTOR) und Transkriptionsfaktor-Bindungsstellen (SITE), aus denen Abstraktionen über TF-Klassen (CLASS) bzw. Nukleotidverteilungsmatrizen (MATRIX) erstellt werden.

Im Zentrum der Datenbank steht die Beziehung zwischen Transkriptionsfaktoren (TF) und ihren DNA-Bindungsstellen (TFBS). Für jeden TF werden, soweit in der wissenschaftlichen Literatur belegt, seine strukturellen und funktionellen Eigenschaften beschrieben. TF werden anhand der Eigenschaften ihrer DNA-Bindungsdomänen zu Familien, Klassen und Überklassen zusammengefasst. Daraus ergibt sich ein Klassifizierungsschema für Transkriptionsfaktoren.[6][7][8][9] Die Bindung eines TF an eine bestimmte Bindungsstelle eines Gens wird mitsamt der genauen Lokalisation dieser Bindungsstelle, ihrer Nukleotid-Sequenz sowie der Methodik, die zu ihrem Nachweis geführt hat, dokumentiert. Auf einen TF (oder eine Gruppe eng verwandter TF) bezogene Bindungsstellen werden aliniert und zu Nukleotidverteilungs-Matrizen (count matrices; position-specific scoring matrices, PSSM) zusammengefasst. Viele Matrizen in der Matrix-Bibliothek von TRANSFAC wurden vom Annotationsteam erstellt, andere aus der wissenschaftlichen Literatur übernommen.

Einsatzgebiete

Die Datenbank TRANSFAC wird u. a. als Enzyklopädie für eukaryote Transkriptionsfaktoren verwendet. Die Zielsequenzen und regulierten Gene können für jeden TF aufgelistet und so umfassende Datensätze für Bindungssequenzen einzelner TF zusammen gestellt werden, etwa als Trainingssequenzen für TFBS-Erkennungsalgorithmen. Die TF-Klassifizierung ermöglicht, solche Datensätze in Zusammenhang mit den Eigenschaften der DNA-Bindungsdomäne zu analysieren.[10] Umgekehrt können für die regulierten Gene diejenigen TF abgerufen werden, für die TFBS in diesen Genen dokumentiert sind. Aus den in TRANSFAC dokumentierten TF-Zielgen-Beziehungen wurden im Zusammenhang mit systembiologischen Untersuchungen auch transkriptionsregulatorische Netzwerke konstruiert und analysiert.[11][12] Die mit Abstand am weitesten verbreitete Anwendung von TRANSFAC beruht jedoch auf der Computer-gestützten Vorhersage potentieller Transkriptionsfaktor-Bindestellen. Verschiedene Algorithmen verwenden dazu die einzelnen TF-Bindungsstellen oder die Matrix-Bibliothek.

Auf TRANSFAC-Inhalten basierende Tools zur Vorhersage von Transkriptionsfaktor-Bindungsstellen sind:

  • Patch – analysiert Sequenzähnlichkeiten mit den in TRANSFAC dokumentierten Bindungsstellen; wird zusammen mit der Datenbank bereitgestellt.[13][14]
  • SiteSeer – analysiert Sequenzähnlichkeiten mit den in TRANSFAC dokumentierten Bindungsstellen.[15][16]
  • Match – identifiziert potentielle TFBS mithilfe der Matrix-Library; wird zusammen mit der Datenbank bereitgestellt.[17][18]
  • TESS (Transcription Element Search System) – analysiert Sequenzähnlichkeiten mit Bindungsstellen aus TRANSFAC sowie potentielle Bindungsstellen mithilfe der Matrix-Libraries aus TRANSFAC und drei weiteren Quellen.[19][20] TESS stellt auch ein Programm zur Identifizierung von cis-regulatorischen Modulen (CRMs, charakteristische Kombinationen von TFBS) bereit, das TRANSFAC-Matrizen nutzt.[21]
  • PROMO – Matrix-basierte TFBS-Vorhersage mithilfe der kommerziellen Datenbank-Version[22][23]
  • TFM Explorer – Identifizierung gemeinsamer potentieller TFBS in einem Satz von Genen[24][25]
  • MotifMogul – Matrix-basierte Sequenzanalyse mit verschiedenen Algorithmen[26]
  • ConTra – Matrix-basierte Sequenzanalyse in konservierten Promotorbereichen[27][28]
  • PMS (Poly Matrix Search) – Matrix-basierte Sequenzanalyse in konservierten Promotorbereichen[29][30]

Abgleich von Matrizen mit denen der Matrix-Bibliotheken aus TRANSFAC und anderen Quellen:

  • T-Reg Comparator[31] zum Vergleich von einzelnen oder Gruppen von Matrices mit denen der TRANSFAC oder anderer Matrix-Bibliotheken.
  • MACO (Poly Matrix Search)[32][33] – Matrix-Vergleich mit Matrix-Bibliotheken

Mithilfe von TRANSFAC vorberechnete genomische Annotationen werden von verschiedenen Servern bereitgestellt.[34][35]

Verwandte Datenquellen

Die folgenden Quellen bieten verwandte oder mit Teilen der TRANSFAC-Datenbank überlappende Inhalte an:

  • JASPAR – Sammlung von Transkriptionsfaktor-Bindungsprofilen (Matrizen) und Sequenzanalyseprogramm
  • PLACE – cis-regulatorische DNA-Elemente in Pflanzen; bis Februar 2007
  • PlantCARE – cis-regulatorische Elemente und Transkriptionsfaktoren in Pflanzen (2002)
  • PRODORIC – ein ähnliches Konzept wie TRANSFAC- aber für Prokaryoten
  • RegulonDB – Focus auf das Bakterium Escherichia coli
  • SCPD – spezifische Daten- und Toolsammlung für Hefe (Saccharomyces cerevisiae) (1998)
  • TFe – The transcription factor encyclopedia
  • TRDD – Transcription Regulatory Regions Database, hauptsächlich über regulatorische Regionen und TF-Bindungsstellen

Einzelnachweise

  1. Wingender E: Compilation of transcription regulating proteins.. In: Nucleic Acids Res. 16, 1988, S. 1879-1902.
  2. Wingender E, Heinemeyer T, Lincoln D: Regulatory DNA sequences: predictability of their function.. In: Genome Analysis - From Sequence to Function; BioTechForum - Advances in Molecular Genetics (J. Collins, A.J. Driesel, eds.). 4, 1991, S. 95-108.
  3. Wingender E, Dietze P, Karas H, Knüppel R: TRANSFAC: a database on transcription factors and their DNA binding sites.. In: Nucleic Acids Res. 24, 1996, S. 238-241.
  4. TRANSFAC Public auf dem Genregulations-Portal der BIOBASE GmbH
  5. Zugang zu TRANSFAC Public über TESS am Computational Biology and Informatics Laboratory (CBIL) der University of Pennsylvania (Penn)
  6. Wingender E: Classification of eukaryotic transcription factors.. In: Mol Biol Engl Tr (Mosk). 31, 1997, S. 483-497.
  7. Heinemeyer T, Chen X, Karas H, Kel AE, Kel OV, Liebich I, Meinhardt T, Reuter I, Schacherer F, Wingender E: Expanding the TRANSFAC database towards an expert system of regulatory molecular mechanisms.. In: Nucleic Acids Res. 27, 1999, S. 318-322.
  8. Stegmaier P, Kel AE, Wingender E: Systematic DNA-binding domain classification of transcription factors.. In: Genome Inform. 15, 2004, S. 276-286.
  9. Wingender, E: The classification of transcription factors
  10. Narlikar L, Gordân R, Ohler U, Hartemink AJ: Systematic DNA-binding domain classification of transcription factors.. In: Bioinformatics. 22, 2006, S. e384-e392.
  11. Goemann B, Wingender E, Potapov AP: An approach to evaluate the topological significance of motifs and other patterns in regulatory networks.. In: BMC Syst Biol. 3, 2009, S. 53.
  12. Kozhenkov S, Dubinina Y, Sedova M, Gupta A, Ponomarenko J, Baitaluk M: BiologicalNetworks 2.0 - an integrative view of genome biology data.. In: BMC Bioinformatics. 11, 2010, S. 610.
  13. Patch auf dem freien Portal von BIOBASE
  14. Matys V, Kel-Margoulis OV, Fricke E, Liebich I, Land S, Barre-Dirrie A, Reuter I, Chekmenev D, Krull M, Hornischer K, Voss N, Stegmaier P, Lewicki-Potapov B, Saxel H, Kel AE, Wingender E: TRANSFAC and its module TRANSCompel: transcriptional gene regulation in eukaryotes.. In: Nucleic Acids Res. 34, 2006, S. D108-D110.
  15. SiteSeer von der University of Manchester
  16. Boardman PE, Oliver SG, Hubbard SJ: SiteSeer: Visualisation and analysis of transcription factor binding sites in nucleotide sequences.. In: Nucleic Acids Res. 31, 2003, S. 3572-3575.
  17. Match auf dem freien Portal von BIOBASE
  18. Kel AE, Gössling E, Reuter I, Cheremushkin E, Kel-Margoulis OV, Wingender E: MATCHTM: a tool for searching transcription factor binding sites in DNA sequences.. In: Nucleic Acids Res. 31, 2006, S. 3576-3579.
  19. TESS (Transcription Element Search System) am CBIL der University of Pennsylvania
  20. Site Search bei TESS
  21. AnGEL CRM Searches im TESS-System
  22. PROMO auf dem ALGGEN-Server der Universitat Politècnica de Catalunya (UPC)
  23. Messeguer X, Escudero R, Farré D, Núñez O, Martínez J, Albà MM: PROMO: detection of known transcription regulatory elements using species-tailored searches.. In: Bioinformatics. 18, 2002, S. 333-334.
  24. TFM Explorer auf dem Bioinformatics Software Server der SEQUOIA-Gruppe
  25. Tonon L, Touzet H, Varré JS: TFM-Explorer: mining cis-regulatory regions in genomes.. In: Nucleic Acids Res. 38, 2010, S. W286-W292.
  26. MotifMogul vom Institute for Systems Biology in Seattle
  27. ConTra von der Universität Gent
  28. Hooghe B, Hulpiau P, van Roy F, De Bleser P: ConTra: a promoter alignment analysis tool for identification of transcription factor binding sites across species.. In: Nucleic Acids Res. 36, 2008, S. W128-W132.
  29. PMS, entwickelt an der Nanjing University
  30. Su G, Mao B, Wang J: A web server for transcription factor binding site prediction.. In: Bioinformation. 1, 2006, S. 156-157.
  31. T-Reg Comparator auf dem Server des Max-Planck-Instituts für molekulare Genetik
  32. MACO, entwickelt an der Nanjing University
  33. Su G, Mao B, Wang J: MACO: a gapped-alignment scoring tool for comparing transcription factor binding sites.. In: In Silico Biol. 6, 2006, S. 307-310.
  34. PReMOD: Menschliches und Maus-Genom aus den Jahren 2004 & 2005; IRCM / McGill University, Montreal
  35. PRIMA: Menschliches Genom von 2004; Tel-Aviv University

Literatur

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • BIOBASE — Infobox Company name = BIOBASE GmbH type = Private foundation = Wolfenbuettel, Germany (1997) location city = Wolfenbuettel location country = EU key people = Michael Tysiak (CFO) Edgar Wingender (CSO) industry = Bioinformatics, databases,… …   Wikipedia

  • Transcription factor — In the field of molecular biology, a transcription factor (sometimes called a sequence specific DNA binding factor) is a protein that binds to specific sequences of DNA and thereby controls the transfer (or transcription) of genetic information… …   Wikipedia

  • Фактор транскрипции — Факторы транскрипции (транскрипционные факторы) белки, контролирующие перенос информации с молекулы ДНК в структуру мРНК (транскрипцию) путем связывания со специфичными участками ДНК.[1][2] Транскрипционные факторы выполняют свою функцию… …   Википедия

  • Edgar Wingender — (* 30. September 1952 im niedersächsischem Liebenau) ist ein deutscher Biochemiker, Molekularbiologe und Bioinformatiker. Er ist seit 2002 Professor und Direktor der neu gegründeten Abteilung für Bioinformatik an der Universitätsmedizin Göttingen …   Deutsch Wikipedia

  • Sequence motif — In genetics, a sequence motif is a nucleotide or amino acid sequence pattern that is widespread and has, or is conjectured to have, a biological significance. For proteins, a sequence motif is distinguished from a structural motif, a motif formed …   Wikipedia

  • B3 domain — protein Name = width = caption = B3 DNA binding domain of RAV1 Symbol = AltSymbols = ATC prefix= ATC suffix= ATC supplemental= CAS number= CAS supplemental= DrugBank= EntrezGene = HGNCid = OMIM = PDB = RefSeq = UniProt = ECnumber = Chromosome =… …   Wikipedia

  • L'Etudiant — L Étudiant  L Étudiant {{{nomorigine}}} Pays …   Wikipédia en Français

  • L'Étudiant — Pour le film américain homonyme, voir L Étudiant (film, 1929). L Étudiant Pays  France Langue …   Wikipédia en Français

  • Président de la Banque centrale européenne — Président de la Banque centrale européenne …   Wikipédia en Français

  • Факторы транскрипции — (транскрипционные факторы)  белки, контролирующие процесс синтеза мРНК на матрице ДНК (транскрипцию) путём связывания со специфичными участками ДНК[1][2]. Транскрипционные факторы выполняют свою функцию либо самостоятельно, либо в комплексе… …   Википедия

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”