Information

Gibt es Einschränkungen, wo Intron/Exon-Grenzen in Bezug auf die Triplett-Codons des Leserasters auftreten?


Ich habe kurz gesucht (hier und anderswo) und nichts zu diesem Thema gefunden. Wenn alle Introns in einem bestimmten primären Transkript auf die gleiche Weise ausgespleißt würden, würde dies keine Rolle spielen. Aber viele eukaryotische Transkripte haben alternative Spleißmuster, so dass eine Version der mRNA kodierende Regionen enthält, die in anderen alternativen Formen fehlen.

Das Problem betrifft die Aufrechterhaltung eines offenen Leserahmens, die Vermeidung einer Rahmenverschiebung und der damit verbundenen (und unvorhersehbaren) Folgen. Wenn eine Spleiß-Donorstelle innerhalb des 3-Basen-Codons auftritt, kann es erforderlich sein, dass sich die zwei (oder mehr) alternativen Akzeptorstellen an derselben relativen Position in einem verwandten Codon befinden.

Die einfachste Lösung für dieses Problem besteht meiner Ansicht nach darin, sicherzustellen, dass sich alle Spleiss-Donor- und -Akzeptor-Stellen an einer Codon/Wort-Grenze befinden.

Gibt es Beweise dafür, dass dies wahr ist?


Wie von anderen betont, ist dies nicht der Fall. Ich habe dies gerade für Menschen überprüft (Anmerkungen von gencode21).

Methodik:

  • Die Startpunkte des CDS für alle Gene erhalten
  • Berechnet für jedes Exon jedes Gens den Abstand zwischen CDS-Start und Exon-Ende
  • Erhalten Sie den Rest, nachdem dieser Wert durch 3 geteilt wurde (Modulo)

Befehle:

Befehl-1: awk 'BEGIN{FS="	|;";OFS="	"} $3=="CDS"{print $4,$9}' gencode.v21.annotation.gtf > cdsstart.txt Befehl-2: awk 'BEGIN{FS="	|;";OFS="	"} NR==FNR{a[$2]=$1;weiter} ($3=="exon" && $9 in a) {wenn ($4>a[$9]) q[($5-a[$9])%3]++} END{for(i in q) print i,q[i]}' cdsstart.txt gencode.v21.annotation.gtf

Ergebnis:

Position | # Fälle _______________________ -2 | 101191 -1 | 100954 0 | 99499

Wie Sie sehen können, enden die Exons nicht unbedingt an der dritten Position des Codons.


Hier sind Exon-Größendaten eines zufälligen Gens (humanes ROR-gamma). Link: http://www.ncbi.nlm.nih.gov/nuccore/NM_005060.3

Es wird an allen drei möglichen Positionen des Codons geschnitten:

Exon 2 30

Exon 3 86

Exon 4 142

Exon 5 513

Exon 6 122

Exon 7 133

Exon 8 108

Exon 9 111

Exon 10 110

Alternativ gespleißte Isoform B dieses Gens erhält ein anderes erstes Exon. An der Kreuzung wird das Codon ACA (Isoform A) durch das Codon TCA (Isoform B) ersetzt.


Ich habe gerade keine Zeit, Beispiele zu finden, aber nein, es ist nicht wahr. Sie erhalten oft Fälle wie diese (Kleinbuchstaben stehen für das Intron):

ACCTGTaccttgcaacttgcatAGCTGAC

Was würde gespleißt werden an:

ACCTCTGAC

Beachten Sie, dass das zweite Codon aus einem Nukleotid von Exon1 und zwei von Exon2 besteht. Ich werde versuchen, dies mit realen Beispielen zu aktualisieren, aber ich kann Ihnen versichern, dass es möglich ist und ich es ziemlich oft gesehen habe.


Wie Alex M zeigt, sind viele Exonslängen 3n+1 oder +2. Es scheint, dass Zellen sich nicht um In-Frame kümmern.

In einigen Fällen verschiebt die Exon-Insertion durch alternatives Spleißen den Rahmen und erzeugt eine kurze Version des Genprodukts oder führt ein vorzeitiges Stoppcodon (PTC) ein. Wenn PCT in Zellen erkannt wird, wird das gespleißte Transkript schnell abgebaut. Dies wird als Nonsense Mediated Decay (NMD) bezeichnet.

Die Spleißmaschinerie kümmert sich nicht um den Rahmen von CDS, und dies ermöglicht verschiedene Genregulationen.

http://genesdev.cshlp.org/content/24/21/2343.full

Diese Übersicht zeigt ein Beispiel für NMD durch alternatives Spleißen. Siehe die Beschreibung zu Caspase-2.


Gibt es Einschränkungen, wo Intron/Exon-Grenzen in Bezug auf die Triplett-Codons des Leserasters auftreten? - Biologie

Die Rh(Rhesus)-Proteinfamilie umfasst Rh50-Glykoprotein und Rh30-Polypeptide, die einen für die Rh-Antigenexpression und die Integrität der Erythrozytenmembran essentiellen Komplex bilden. Dieser Artikel beschreibt die strukturelle Organisation des Rh50-Gens und die Identifizierung seines assoziierten Spleißdefekts, der Rh . verursachtNullKrankheit. Das Rh50-Gen, das auf Chromosom 6p11–21.1 kartiert wird, hat eine Exon/Intron-Struktur, die fast identisch mit den Rh30-Genen ist, die bei 1p34–36 kartiert werden. Von den 10 zugewiesenen Exons ist die Konservierung von Größe und Sequenz hauptsächlich auf die Region von Exon 2 bis 9 beschränkt, was darauf hindeutet, dassRH50 und RH30 wurden als zwei separate genetische Loci von einem gemeinsamen Vorfahren über ein transchromosomales Insertionsereignis gebildet. Die verfügbaren Informationen zum Aufbau von RH50erleichterte die Suche nach Kandidatenmutationen, die dem Rh-Mangelsyndrom zugrunde liegen, einer autosomal-rezessiven Erkrankung, die durch leichte bis mittelschwere chronische hämolytische Anämie und Sphärostomatozytose gekennzeichnet ist. Bei einem Patienten mit RhNull Bei einer Erkrankung vom Regulatortyp wurde ein verkürztes Rh50-Transkript ohne die Sequenz von Exon 7 nachgewiesen, während in Transkripten, die Rh30-Polypeptide und Rh-verwandtes CD47-Glykoprotein kodieren, keine Abnormalität gefunden wurde. Amplifikation und Sequenzierung der genomischen Region, die Exon 7 umspannt, ergab einen G → A-Übergang im invarianten GT-Motiv der Donor-Spleißstelle in beiden Rh50-Allelen. Diese Splicing-Mutation verursachte nicht nur ein totales Skipping von Exon 7, sondern auch einen Frameshift und einen vorzeitigen Kettenabbruch. Somit enthielt das abgeleitete Translationsprodukt 351 anstelle von 409 Aminosäuren mit einer völlig anderen C-terminalen Sequenz nach Thr 315 . Diese Ergebnisse identifizieren den Spenderspleißdefekt zum ersten Mal als eine funktionslose Mutation an derRH50 Locus und zeigen die Bedeutung der C-terminalen Region von Rh50 bei der Rh-Komplexbildung über Protein-Protein-Wechselwirkungen auf.

Diese Arbeit wurde teilweise durch das National Institutes of Health Grant HL54459 unterstützt. Die Kosten für die Veröffentlichung dieses Artikels wurden teilweise durch die Zahlung von Seitengebühren bestritten. Der Artikel muss daher hiermit gekennzeichnet werden „Werbung“ gemäß 18 U.S.C. § 1734 nur, um auf diese Tatsache hinzuweisen.

Die in diesem Artikel berichtete(n) Nukleotidsequenz(en) wurden bei der GenBank™/EMBL-Datenbank mit den Zugangsnummern AF031548, AF031549, AF031550 und AF031551 eingereicht.


Einführung

Vor über dreißig Jahren führte die Entdeckung, dass eukaryotische Gene gespalten wurden, unterbrochen durch nicht-kodierende DNA (z. B. [1], [2], [3]), eine Revolution in der Biologie. Die funktionellen und evolutionären Konsequenzen dieser unerwarteten Genstruktur wurden von W. Gilbert in einem berühmten und kurzen Artikel, in dem er die Begriffe Intron und Exon prägte, sofort vorausgesehen [4]. Seit dieser Zeit ist die Existenz von Introns in nuklearen Genen die Quelle einer langjährigen – und in manchen Aspekten noch andauernden – Debatte. Bei dieser Debatte geht es darum, ob Introns ganz am Anfang des Lebens vorhanden waren (die sogenannte “intron-Early-Theorie”) oder viel später in zuvor ununterbrochene Kodierungssequenzen eingefügt wurden (Intron-Late). Vorhersagen beider Theorien wurden mit zunehmend verfügbaren Daten getestet, wenn auch mit manchmal gegensätzlichen Ergebnissen. Beispielsweise wurden Vorhersagen der Intron-Early-Theorie bezüglich der Intron-Phasenverteilung (ein Überschuss an Phase-0-Introns) für alte Gene bestätigt, jedoch wurden von verschiedenen Autoren widersprüchliche Interpretationen gegeben, je nach den von ihnen verwendeten analytischen Modellen [5], [6 ], [7]. Für Intron-späte-Anhänger wurde das Alter der ersten Introns früher als relativ jung angesehen, da zunächst bekannte Introns in mitochondrienlosen Eukaryoten (genannt Archezoa [8]) fehlten. Große Fortschritte in der Debatte wurden durch die allgemeinen Bemühungen zur Genomsequenzierung einer Reihe von Eukaryoten und Prokaryoten gebracht, die gezeigt haben, dass (1) allen sequenzierten Prokaryoten spleißosomale Introns und die Elemente der Spleißmaschinerie fehlen und (2) fast allen Bisher sequenzierte Eukaryoten besitzen mindestens einige spliceosomale Introns und alle weisen Elemente des Spleißosoms auf [9]. Dies zeigt nach Meinung vieler Autoren, dass Introns in einem sehr frühen Stadium ihrer Evolution in Eukaryoten eingebaut wurden, sodass alle existierenden Eukaryoten von einem introntragenden und potenziell intronreichen Vorfahren abstammen [10], [11] , [12]. Die potenzielle Intron-Ausbreitung war eng mit dem immer noch mysteriösen Ursprung von Eukaryoten verbunden (z. B. Lit. [13]), möglicherweise gleichzeitig damit, und Introns könnten durch Exon-Shuffling, alternatives Spleißen und Überwachung der mRNA-Integrität ein starker Booster für evolutionäre Neuheiten gewesen sein , die die Rekombination fördern und begünstigen [14], [15], [16], [17], [18]. Tatsächlich, wie Lynch und Richardson sagten [16], “it ist wahrscheinlich, dass nur wenige der heutigen Eukaryoten ohne Introns überleben könnten”.

Der Fokus der Debatte hat sich heute auf das Verständnis von Introngewinnen und -verlusten im Laufe der Geschichte der Eukaryoten und die Schätzung der Introndichte im Genom des letzten eukaryotischen gemeinsamen Vorfahren verlagert. Sind Intronverluste häufiger als Introngewinne und wenn ja, seit wann ist dies der Fall? Oder waren im Gegensatz dazu Zuwächse in der Vergangenheit zu einem bestimmten Zeitpunkt ein hochfrequentes Phänomen und sind danach in jüngerer Zeit zu seltenen Ereignissen zurückgegangen? Sind Gewinn- und Verlustraten korreliert? Sind die Gewinn- und Verlustraten von der Abstammungslinie abhängig? Genomdaten zeigen zunehmend signifikante Mengen entsprechender Intronpositionen in konservierten orthologen Genen zwischen entfernten Eukaryoten wie Pflanzen und Tieren [10] [19] [20] [21]. Das Ausmaß, in dem diese zufälligen Positionen echte orthologe Introns (d. h. im gemeinsamen Vorfahren vorhanden) oder parallele Verstärkungen widerspiegeln, wurde von mehreren Arbeitern geschätzt, bleibt jedoch umstritten (Übersicht in [22]).

Ein besonderer noch zu klärender Punkt ist die Genabhängigkeit der Introndynamik. Viele Autoren haben die Bedeutung von Introns für die Funktionen einer Reihe von Genen betont, zum Beispiel wegen des Vorhandenseins von regulatorischen Informationen innerhalb von Introns (z. B. [23]) oder wegen der Größe von Introns, die einfach als Zeitgeber für die richtige zeitliche Expression in der Embryoentwicklung [24] oder wegen ihrer Rolle bei der mRNA-Überwachung durch den Nonsense Mediated Decay (NMD)-Prozess [17]. Wenn sich Introns in ihren funktionellen Rollen signifikant unterscheiden, werden genomische Studien von Introns dazu neigen, Introns zu bündeln, auf die selektive Kräfte unterschiedlich wirken, und Unterschiede in den Folgen der funktionellen Fitness der Introndynamik (d. h. Gewinn oder Verlust) werden übersehen.

Die Untersuchung der Introndynamik in einem einzelnen Gen (oder einer Genfamilie) in verschiedenen Spezies kann in dieser Hinsicht wertvoll sein [25]. Wir verglichen Intron-Exon-Strukturen in Alpha-Amylase-Genen von Tieren, um die Vielfalt der Introndynamik in Genen mit identischer Funktion in verschiedenen Organismen zu veranschaulichen. Alpha-Amylasen bilden in den meisten Organismen, einschließlich Tieren, eine Multigenfamilie [26] [27] [28] [29] [30], aber alle Kopien haben praktisch die gleiche Funktion beim Abbau von Stärke und verwandten Polysacchariden (http: //www.cazy.org [31]). Die Aminosäuresequenz ist unter Königreichen schlecht konserviert [32], so dass Vergleiche von Intron-Exon-Strukturen mit Pflanzen oder Pilzen unzuverlässig sind. Obwohl es aufgrund der Erhaltung der dreidimensionalen Struktur möglich ist, strukturelle Alignments durchzuführen, bleiben solche Alignments mehrdeutig und auf kleine Teile der Sequenz beschränkt. Da die Untersuchung von Introngewinnen und -verlusten durch die Erhaltung der Intronpositionen eindeutige Ausrichtungen erfordert, haben wir unsere Untersuchung auf Amylasen vom Tiertyp in Bilateria beschränkt, die gut zueinander ausgerichtet sind. In nicht-bilaterianischen Metazoen, d. h. Porifera und Cnidaria [34] und Placozoa (unveröffentlicht), wurde bisher keine Amylase vom Tiertyp (Unterfamilie GH13_15/24 [33]) gefunden. Stattdessen Pilz-Typ (GH13_1) Alpha-Amylase, auch genannt Dictyostelium-Typ, scheint der übliche und angestammte Typ in Unikonts zu sein, mit Ausnahme von Bilateria. In Bezug auf den Fokus der vorliegenden Arbeit ist es interessant festzustellen, dass die hier untersuchte Alpha-Amylase vom Tiertyp als “recent”-Gen angesehen werden kann, da angenommen wird, dass sie durch horizontalen Transfer bakteriellen Ursprungs ist [34]. Daher sollte die Ahnenstruktur ohne Intron sein. Wie unten detailliert beschrieben, sind die Intron-Exon-Strukturen unter Tierarten sehr unterschiedlich, sogar beispielsweise innerhalb von Insekten. Wichtig ist, dass weder alternatives Spleißen noch regulatorische Informationen innerhalb von Amy Introns wurden bisher in Amylasen beschrieben. Daher werden Amylasegene als frei von dieser Art von Beschränkungen angesehen, so dass die beobachteten strukturellen Unterschiede leichter interpretiert werden können: Intronpositionen, -größen, -verluste oder -gewinne können eher mit Faktoren im Zusammenhang mit Spleißmechanismen und -erfordernissen sowie der Erkennung zusammenhängen von Introns und Exons oder auf extrinsischere Faktoren, wie Lebenszyklus und Populationsgröße. Wiederholte Intronverluste in Amylase-Genen wurden bei Drosophila und anderen Diptera berichtet [35] [36]. Diese Studie erweitert die Untersuchung auf die Bilateria.


Diskussion

Die oben vorgestellte Theorie behandelt die Geburt eines Introns als ein autonomes Ereignis, unabhängig von der Anwesenheit anderer Introns innerhalb des interessierenden Gens oder anderswo im Genom. Über die Quelle neuer nuklearer Introns ist wenig bekannt, und es ist vorstellbar, dass erfolgreiche Ursprünge lediglich eine kleine Teilmenge der zufälligen Insertionen darstellen, die innerhalb eines Genoms durch das Einfangen entstehender DNA-Fragmente durch Doppelstrangbrüche entstehen (35). Um als erfolgreiches nukleares Intron zu dienen, müssten solche Insertionen zufällig mit allen Schlüsselsequenzen ausgestattet werden, die für das richtige Spleißen notwendig sind. Obwohl solche Ereignisse sehr selten sein können, ist klar, dass de novo Introns entstehen können. In Pflanzen dienen zum Beispiel Insertionen mit einer adäquaten AT-Reichheit als Kerne neuer Introns, die sich zu benachbarten GT/AG-Grenzen erstrecken, die bereits innerhalb kodierender Regionen existieren (36). Reverse Transkripte von gespleißten Introns haben vermutlich eine gewisse Möglichkeit, sich wieder in das Kerngenom einzufügen, und diese Transkripte wären natürlicherweise mit Erkennungssequenzen ausgestattet. Die Entstehung eines nuklearen Introns durch intragenomische Duplikation eines bereits bestehenden Introns konnte jedoch bisher nur in einer einzigen Studie nachgewiesen werden (21). Insertionen von transponierbaren Elementen können manchmal zu funktionellen Introns führen (37), aber es gibt noch keinen zwingenden Beweis dafür, dass dies auch eine übliche Entstehungsweise erfolgreicher Introns ist. Unabhängig von dem Mechanismus, durch den funktionelle Introns entstehen, liefert die populationsgenetische Behandlung der Intron-Evolution als Geburts-Tod-Prozess qualitative Vorhersagen, die mit einer Reihe von Beobachtungen zur phylogenetischen und genomischen Verteilung von Introns übereinstimmen.

Intron-Abundanz und effektive Populationsgröße.

Befürworter der Introns-Early-Hypothese berufen sich im Allgemeinen auf die Selektion auf ein optimiertes Genom, um die Seltenheit von Introns in modernen Prokaryonten zu erklären. Die oben präsentierten einfachen populationsgenetischen Argumente stellen diese Ansicht jedoch in Frage. Im Großen und Ganzen haben einzellige Organismen größere Populationsgrößen als mehrzellige Arten, und die Mehrheit der einzelligen Arten kann globale effektive Populationsgrößen von ≫10 10 aufweisen, was groß genug ist, damit der sehr schwache Mutationsdruck gegen neugeborene Introns evolutionär bedeutsam wird. Wenn die Intronverarbeitung zusätzliche Kosten verursacht, entweder in Bezug auf den Energiebedarf oder in Bezug auf Fehler, die durch den Spleißprozess verursacht werden, werden die oberen Grenzwerte für die Populationsgröße, die für die Intronbildung zulässig sind, noch niedriger sein. Darüber hinaus gilt für frühe Lebensformen ohne verfeinerte DNA-Reparaturwege, S war wahrscheinlich wesentlich größer als heute, was die kritische effektive Größe noch weiter reduziert und die Idee, dass der kreative Zusammenbau früher Gene durch Introns erleichtert wurde, noch weniger plausibel macht.

Eine sparsame Erklärung für die Seltenheit von Introns in Prokaryoten ist daher, dass ein schwacher Mutationsdruck die Etablierung funktioneller Introns in Taxa verhindert, für die die durchschnittliche Populationsgröße ausreichend groß ist. Wenn diese Hypothese richtig ist, würden wir auch erwarten, dass Introns in einzelligen Eukaryoten selten sind, wiederum nicht wegen eines Versäumnisses, Introns zu erfinden, sondern wegen der mutationsbedingten Beschränkungen ihrer Proliferation. Im Allgemeinen enthalten die Kerngenome einzelliger Protisten und Pilze eine relativ geringe Anzahl von Introns im Vergleich zu denen mehrzelliger Pflanzen und Tiere (38–40). Die durchschnittliche Größe der Introns bei einzelligen Eukaryoten ist auch viel kleiner als bei mehrzelligen Arten (41), was den Erwartungen entspricht, wenn Insertionen in Introns schädlicher sind als Deletionen (siehe nächster Abschnitt). Das Vorhandensein von mindestens einigen wenigen Kernintrons in den meisten der stark divergierenden Basalgruppen von Eukaryoten (42) deutet darauf hin, dass der Spleißosomenapparat möglicherweise im gemeinsamen Vorfahren aller Eukaryoten vorhanden war würde die Idee weiter untermauern, dass die notwendigen Populationsgröße/Mutationsraten-Anforderungen für die Intron-Proliferation erst nach dem Ursprung der Multizellularität und der damit verbundenen Reduktion der effektiven Populationsgröße erfüllt wurden. Die erhöhte Häufigkeit von Introns in vielen Abstammungslinien von Organellengenomen (Chloroplasten und Mitochondrien) von Pflanzen und Pilzen (im Vergleich zu ihren prokaryontischen Vorfahren, Ref. 5) stimmt auch mit dieser Idee überein, da die effektive Populationsgröße einer Organelle 25–100 % des eukaryontischen Wirts, abhängig von der Art der Organellenvererbung.

Introngröße und Rekombinationsfrequenz.

Genomweite Analysen von D. melanogaster und Wirbeltiere weisen darauf hin, dass Introngröße und -zahl in Regionen geringer Rekombination zunehmen (43–45). Carvalho und Clark (43) schlagen vor, dass diese Beziehung eine evolutionäre Folge der verringerten Effizienz der Selektion gegen Insertionsmutationen in Regionen geringer Rekombination ist (Hill-Robertson-Effekt). Im Gegensatz dazu argumentieren Comeron und Kreitman (44), dass Deletionsmutationen den Insertionen zahlenmäßig überlegen sind, dass ein selektiver Vorteil für große Introns in Regionen mit geringer Rekombination den direktionalen Mutationsdruck auf eine kleine Introngröße ausgleichen muss. Sie vermuten, dass große Introns, indem sie als Modifikatoren der Rekombinationsrate wirken, die Last reduzieren können, die durch schädliche Mutationen verursacht wird, die sonst in Regionen mit geringer Rekombination erwartet werden. Es ist jedoch unklar, ob es in D. melanogaster oder irgendeine andere Spezies (46).

Die Hypothese des schwachen Mutationsdrucks liefert eine formale Erklärung für die Assoziationen der Intronhäufigkeit und -größe mit der Rekombinationsfrequenz, die mit Carvalho und Clark übereinstimmt (43). Erstens ist die Verringerung der effektiven Populationsgröße in Regionen mit geringer Rekombination der Etablierung und Retention von Introns förderlich ( 1 ).Zweitens, wenn es einen schwachen selektiven Vorteil für eine reduzierte Introngröße gibt (z Mutationen) ist in Regionen mit geringer Rekombination vermutlich schwächer. Ungeachtet der relativen Raten von Mutationen zu Insertionen und Deletionen wird der Hill-Robertson-Effekt das Gleichgewicht in Richtung Insertionen in Regionen mit geringer Rekombination kippen. Somit scheint es keinen Grund zu geben, sich auf einen sekundären Vorteil der Rekombinationsfrequenzmodifikation zu berufen.

Intron-Abundanz und Intron-Erkennungseigenschaften.

Zusammen mit Eigenschaften auf Populationsebene (z. B. effektive Größe) und Eigenschaften auf Chromosomenebene (z. B. Rekombinationshäufigkeit) beeinflussen Aspekte von Intron-Erkennungssequenzen wahrscheinlich die relative Häufigkeit von Introns in verschiedenen Abstammungslinien. Strengere Anforderungen an die Intron-Erkennung implizieren eine höhere Anfälligkeit für Intron-schwächende Mutationen (höhere S), eine geringere Wahrscheinlichkeit eines zufälligen Intronursprungs (niedriger B) und damit eine geringere Gleichgewichtseinfall von Introns.

Ein mögliches Beispiel für genomische Unterschiede in der Intron-Häufigkeit, die aus Unterschieden in den Intron-Erkennungssequenzen resultieren, ist der Kontrast zwischen knospenden Hefen (S. cerevisiae), das, wie oben erwähnt, eine sehr strenge Anforderung an eine Verzweigungspunktsequenz von sieben Nukleotiden hat, und Spalthefe (S. pombe), für die die intronischen Sequenzen viel weniger konserviert sind. Der Einfall von Introns ist ungefähr 9-fach in . aufgeblasen S. pombe (47) und eine ähnliche Inflation ist in Neurospora crassa, die auch gelockerte Spleißanforderungen hat (48). Ein zweites mögliches Beispiel betrifft die Beobachtung, dass Introns in Gefäßpflanzengenen in genomischen Regionen mit hohem GC-Gehalt viel seltener sind (49). Da pflanzliche Introns einen hohen AT-Gehalt für effizientes Spleißen haben (13), wird erwartet, dass Introns in GC-reichen Regionen unter der Annahme, dass regionale Unterschiede im GC-Gehalt teilweise aus dem unterschiedlichen Mutationsdruck resultieren, eine höhere degenerative Mutationsrate erfahren und daher eine geringere Inzidenz zu haben.

Eine ähnliche Logik hilft, die Ungleichheit der relativen Häufigkeiten verschiedener Arten von Introns innerhalb desselben Genoms zu erklären. Obwohl beispielsweise >99% aller eukaryotischen Introns vom klassischen GT-AG-"U2-Typ" zu sein scheinen, ist bekannt, dass ein sehr seltener AT-AC-Typ in mehreren Gruppen von Eukaryoten (einschließlich Pflanzen, Nesseltieren, Arthropoden und Wirbeltiere, jedoch keine Pilze oder Nematoden, Ref. 9). Es gibt keine Hinweise darauf, dass sich die beiden Arten von Introns in Bezug auf direkte Auswirkungen auf die individuelle Fitness oder auf die Fähigkeit zur Proliferation intrinsisch unterscheiden. Introns vom U12-Typ unterscheiden sich jedoch dadurch, dass sie eine hochkonservierte 5'-Spleißstelle (ATATCCTT) und eine hochkonservierte Verzweigungssequenz (TCCTTAAC) aufweisen, ganz im Gegensatz zu den gelockerten Sequenzanforderungen für Introns vom U2-Typ. Dieser größere Konservierungsgrad impliziert, dass Introns vom U12-Typ durch Mutation viel leichter außer Gefecht gesetzt werden als Introns vom U2-Typ, obwohl einige Mutationstypen einfach den U12-Typ in den U2-Typ umwandeln (9). Somit stimmt die extrem geringe Inzidenz von Introns vom U12-Typ bei allen Arten (und ihr vollständiges Fehlen bei einigen) mit den Erwartungen des Geburts-Tod-Modells überein.

Genomkomplexität als pathologische Reaktion auf eine kleine Populationsgröße.

Die Ergebnisse dieser Studie legen nahe, dass die einfache Struktur von Genen in Mikroben im Vergleich zu höheren Eukaryoten wenig mit selektiven Beschränkungen (genomische Straffung bei Mikroben) oder adaptiven Anforderungen (Ausweitung der zellulären Komplexität in mehrzelligen Eukaryoten) zu tun haben könnte. Vielmehr können die Genome von Arten mit gewöhnlich großen Populationsgrößen einfach durch die Kraft der sekundären Mutation gegen die Verbreitung von Introns immunisiert werden. Dies ist der zweite Fall, in dem wir gezeigt haben, dass genomische Komplexität passiv als Reaktion auf eine kleine Populationsgröße entstehen kann, ohne direkte Selektion auf organismische Komplexität und ohne adaptive Bedeutung. Wir haben bereits gezeigt, dass doppelte Gene durch Subfunktionalisierung (Aufteilung von Genfunktionen) in kleinen Populationen konserviert werden können, eine solche Konservierung jedoch unwahrscheinlich ist, sobald eine Population eine ausreichend große Größe erreicht, wiederum weil der Fixierung subfunktionalisierter Allele die schwache Selektion entgegensteht induziert durch sekundäre Mutationen in großen Populationen (50). Die Evolution der Komplexität des Organismus kann eher eine sekundäre Folge als eine primäre Ursache der Genomkomplexität sein.


DISKUSSION

Es wurde gezeigt, dass exonische Sequenzen, wie die Exons 9 und 12 des Transmembran-Leitfähigkeitsregulators für zystische Fibrose und Fibronectin EDA, aus evolutionärer Sicht durch Spleißerfordernisse eingeschränkt sind. Es wurde vermutet, dass diese Art von Einschränkung die funktionell produktive Genomvariabilität einschränkt (16, 40–42). Unter Verwendung der Alkalischen Phosphatase-Genfamilie (ALPP) als Modell haben wir nun eine detaillierte Analyse der doppelten Rolle von kodierenden Sequenzen durchgeführt – Aminosäurekodierung und ESE-Konservierung, die speziell im Hinblick auf die Wirkung auf die Proteinleistung analysiert wurden.

Aktuelle Ansichten zur Evolutionsgeschichte von ALP schlagen vor, dass das Vorfahrengen für eine gewebeunspezifische alkalische Phosphatase kodiert und dass anschließend durch einen Prozess der Genduplikation und zusätzlichen Mutationen das intermediäre intestinale Gen aus dem gewebeunspezifischen Vorläufer entsteht Gen (ALPL wie). Dieses Gen wurde durch verschiedene Veränderungen in den Promotorregionen der Gene ( 43, 44) zum Vorläufer von Darm-, Keimzell- und Plazenta-Genen ( 45). Tatsächlich stellt das ALPP-Gen ein spätes evolutionäres Ereignis dar, da Enzyme mit den Eigenschaften von PLAP (Proteinprodukt des ALPP-Gens) nur in der Plazenta von Schimpansen, Orang-Utans und Menschen exprimiert gefunden wurden (45, 46), während in mehreren anderen Säugetierarten PLAP und TNAP (Proteinprodukt des ALPL-Gens) sind äquivalent (34, 47). Die paraloge Genfamilie der humanen alkalischen Phosphatase ist somit ein Beispiel für eine Subfunktionalisierung, da diese Gene in verschiedenen Geweben exprimiert werden, wobei immer noch die gleichen Merkmale des katalytischen Mechanismus beibehalten werden (48), jedoch mit unterschiedlichen enzymatischen Eigenschaften. Diese Eigenschaftsunterschiede können spezifische in-vivo-Funktionen widerspiegeln ( 34). Tatsächlich können sich die Aminosäurevariationen zwischen dem gewebespezifischen ALPP und denen in der entsprechenden Region von ALPL, einschließlich Gly93, Ala94 und Arg125, aufgrund von Proteinvariationen entwickelt haben, die mit der Enzymspezialisierung oder dem Erwerb neuer Proteineigenschaften verbunden sind. Eine alternative Hypothese, die wir bevorzugen, ist, dass sie einen evolutionären Druck widerspiegeln, der mit Gewürzbeschränkungen verbunden ist. In dieser Studie haben wir gezeigt, dass die Nukleotide, die für diese Aminosäuren kodieren, für ESEs spezifizieren, die für die korrekte Aufnahme des Exons 4 in die mRNA aufgrund seiner schwachen 3'-Spleißstelle notwendig sind. Diese Nukleotide unterscheiden sich von denen in der entsprechenden Region der ALPL in einer ansonsten stark konservierten Region, wo gezeigt wurde, dass die ESEs aufgrund der starken 3'-Spleißstelle dieses Exons fehlen und unnötig sind. Die verschiedenen Nukleotidsequenzen kodieren wiederum für verschiedene Aminosäuren, die, wie wir auch gezeigt haben, wenn sie in ALPL eingebracht werden, die enzymatischen Eigenschaften des Proteins verändern. Die Tatsache, dass diese Aminosäuren in ALPP ohne anormales RNA-Spleißen und negative Konsequenzen auf den Einschluss des Exons nicht zu denen von ALPL verändert werden konnten, legt die Existenz von Splicing-Beschränkungen bei der Proteinsequenz-Evolution nahe. Da ALPL als die Urkopie von AP angesehen wird ( 38), sind mindestens zwei Hypothesen möglich, um die zeitliche Abfolge der unterschiedlichen Spleißregulationsmotive zu erklären: (i) Mutationen im Exon könnten zur Bildung einer der ESE-Nukleotidsequenzen geführt haben und daraus folgende Variationen in der Aminosäuresequenz. Anschließend könnten Nukleotidänderungen entweder in der exonischen Region, die die zweite ESE erzeugt, oder innerhalb der 3'-Spleißstelle auftreten. Im ersteren Fall hätte es keine Auswirkung auf das Spleißen, aber das Ergebnis wäre nur auf die Proteinaktivität. Wenn es andererseits an der 3′-Spleißstelle auftritt, die deren Stärke verringert, könnte mit nur einer ESE ein partielles aberrantes Spleißen auftreten, wie wir in Abbildung 3 gezeigt haben AP-Funktion. (ii) Die anfängliche Mutation schwächt die 3'-Spleißstelle, dieser Fall überlappt teilweise mit der Sequenz ESE-Erzeugung und dann 3'-Spleißstellen-Mutation von Hypothese 1. In beiden gibt es minimales Spleißen der korrekten mRNA, die die Proteinfunktion gewährleistet (Abbildung 3), dann Die Optimierung der mRNA- und Proteinproduktion könnte durch die Auswahl von Mutationen erreicht werden, die eine ESE erzeugen, der Preis für diese Optimierung könnten Aminosäurevariationen sein, die die Proteineigenschaften verändern.

Um zu versuchen, die zeitliche Abfolge von Ereignissen zu bestimmen, die zu dieser Einschränkung führten, führten wir ein vergleichendes genomisches Alignment von ALPP-Orthologen und rekonstruierten Vorfahrensequenzen durch, an denen ESE-Rescue-Motiv und 3′-Spleißstellen-Stärkeanalysen durchgeführt wurden (Ergänzende Abbildung S1). Diese Analyse konnte nicht schlüssig zwischen den Möglichkeiten unterscheiden, dass die ESEs vor oder nach der Schwächung der 3'-Spleißstelle auftraten. Eine Analyse der phylogenetischen Verwandtschaft der Orthologe zusammen mit rekonstruierten Vorfahrenknoten zeigt, dass die Knoten vor dem Zweig, der zu den hypothetischen taxonomischen Einheiten führt, eine starke 3′-Spleißstelle tragen und nicht die von uns charakterisierten ESE-Elemente aufweisen, bis der Knoten, der zu Primaten (Ergänzende Abbildung S2). In Anbetracht der Tatsache, dass ALPL die uraltere Art der AP-Familie ist ( 38), spekulieren wir, dass zuerst eine Mutation in der Spleißstelle aufgetreten ist, die die 3′-Spleißstelle schwächt und somit einen Selektionsdruck auf stärkere Spleißverstärker ausübt, um das richtige Exon zu kompensieren Aufnahme. Diese Annahme ist mit unseren Daten für die ALP-Familie kompatibel, da wir in diesem Fall festgestellt haben, dass in Gegenwart der schwachen 3′-Spleißstelle immer noch ein gewisser Exon-Einschluss auftritt (Abbildungen 3 und 4). Diese Hypothese steht auch im Einklang mit dem Spleißkompensationsmodell (14), bei dem eine Selektion auf spleißpositive Mutationen stattfindet, um dem Effekt eines laufenden spleißnegativen Mutationsprozesses entgegenzuwirken, wobei das Exon als Ganzes erhalten bleibt. Dieses Modell zeichnet ein Bild der Exon-Evolution als dynamisches Wechselspiel zwischen hilfreichen und schädlichen Mutationen sowohl auf der enzymatischen Funktion als auch auf der Ebene des Prä-mRNA-Spleißens, die kontinuierlich am Werk sind.

Da ALPP zu 90 % homolog zu den anderen beiden gewebespezifischen Isozymen ist, ist es verlockend anzunehmen, dass die gleichen Ergebnisse, die bei ALPP in Bezug auf Spleißen und Proteinaktivität erzielt wurden, auch bei ALPPL2 und ALPI auftreten würden, was es möglich macht, unser Modell auf a allgemeinere evolutionäre Theorie des Spleißens von Motiven vom gewebeunspezifischen Vorfahrengen zu den weniger entfernten gewebespezifischen Paralogen. In diesem Fall ist jedoch interessant, dass aufgrund der Degeneration des genetischen Codes auch Szenarien ähnlich denen möglicherweise bei ALPI auftreten werden, bei denen die Nukleotide noch für die bei ALPL beobachtete Aminosäure (Glycin) kodieren können. unter Beibehaltung der ESE (Abbildung 2).

Unabhängig davon, wie sich die Gene entwickelt haben, ist die Bedeutung des doppelten Zwecks der kodierenden Sequenz für die Genevolution klar. Sequenzen müssen zwei möglicherweise widersprüchliche Funktionen erfüllen: das Erfordernis, das in der reifen mRNA enthaltene Exon zu erhalten, und die Auswahl von Sequenzvarianten, die Aminosäuren kodieren, die die Enzymleistung verändern. Mit dem Splicing-getriebenen Selektionsdruck vor der Proteinfunktionsselektion als Voraussetzung für seine Translation ( 7 ) können wir schlussfolgern, dass die Proteinaktivität möglicherweise nicht so optimal wie möglich ist. Tatsächlich zeigen unsere Ergebnisse zum ersten Mal, dass genomische Variationen, die für die Aminosäuresubstitution kodieren, zuerst auf Spleißebene eingeschränkt werden können, um in den Botenstoff aufgenommen zu werden und erst dann der Proteinleistung bestimmte Eigenschaften zu verleihen.


Ergänzende Abbildung 1 Wahrzeichen der sexuellen Differenzierung und Verteilung von Reads über mRNA-Merkmale.

(A) Kinetik der sexuellen Differenzierung. Diploide Zellen werden in G1 durch Stickstoffmangel synchronisiert und die Meiose wird zum Zeitpunkt 0 durch Hitzeinaktivierung des wärmeempfindlichen Pat1 induziert. Die S-Phase (S) findet 2 Stunden nach der meiotischen Induktion statt. Die meiotischen Teilungen erfolgen nach 5 Stunden (MI) und 5,5 Stunden (M II). Der Vorläufer der Sporenplasmamembran (Vorsporenmembran, F) wird zwischen 5,5 und 6,5 Stunden erzeugt und die Sporenzellwand erscheint nach 10-12 Stunden (Spo). Das Fortschreiten der meiotischen Teilungen wurde durch Färben der Zellen mit DAPI gefolgt von der Quantifizierung von Zellen mit 1 Kern (vor der meiotischen Teilung), 2 Kernen (nach der ersten Teilung) und vier Kernen (nach der zweiten Teilung) verfolgt. Die Daten entsprechen einem einzelnen Experiment. (B) Verteilung von Reads über RNA-Features. Der Anteil der Reads, die auf kodierende Sequenzen (CDS), 5'-Leader-Regionen und 3'-UTRs kartieren, ist für RPFs und mRNAs gezeigt. (Links) Nicht normalisierte Daten. (Rechts) Daten normalisiert durch die Länge des entsprechenden genomischen Merkmals.

Ergänzende Abbildung 2 Reproduzierbarkeit von RPF- und mRNA-Messungen.

(A) Streudiagramm zum Vergleich der mRNA-Read-Zählungen (in Reads pro Million) für jedes CDS für zwei unabhängige biologische Wiederholungen von pat1-Zellen 3 Stunden (links) oder 5 Stunden (rechts) nach der meiotischen Induktion. Auf die Daten wurde keine Filterung angewendet. Pearson-Korrelationskoeffizienten sind in den Kästchen angegeben. (B) Wie in A, aber mit RPF-Zählungen. (C) Wie in A, aber Anzeige von TEs, berechnet durch Normalisieren der RPF-Zählungen für jedes CDS durch die entsprechende Anzahl von mRNA-Zählungen. Daten werden nur für Gene angezeigt, die mindestens 10 Reads in den mRNA- und den RPF-Daten hatten. Beachten Sie, dass es sich um völlig unabhängige Proben handelt, da die beiden Kulturen an verschiedenen Tagen geerntet wurden und die Bibliotheken separat hergestellt und sequenziert wurden.

Ergänzende Abbildung 3 Globale Veränderungen der Translations- und mRNA-Spiegel während der Meiose.

(A) Die 1.719 Gene, die die stärksten Expressionsänderungen während eines meiotischen Zeitverlaufs zeigten, wurden basierend auf ihren RPF-Profilen geclustert. Die Heatmap zeigt mRNA-Daten basierend auf einem veröffentlichten Microarray-Experiment, mRNA-seq-Daten aus dieser Arbeit (Mitte) und RPF-Änderungen (rechts). Die Farben stellen logarithmische Verhältnisse der Genexpression im Vergleich zu den entsprechenden vegetativen Zellen dar. (B) Korrelationen zwischen dem TE von uORFs und ihren entsprechenden ORFs. Boxplots, die das Protokoll anzeigen2 Verhältnisse zwischen den TEs jedes übersetzten uORF und seines stromabwärts gelegenen ORF. TEs wurden für jeden Zeitpunkt berechnet und durch die mittlere TE über den Zeitverlauf normalisiert. Veg zeigt vegetativ wachsende Zellen an, und die Zeit ist die Anzahl der Stunden seit der Temperaturverschiebung, um die Meiose zu induzieren. (C) Übersetzung von SPBPB10D8.07c mRNA. Die y-Achse repräsentiert die TE für den uORF (rot) und den entsprechenden ORF (blau) für jeden Zeitpunkt des meiotischen Zeitverlaufs. SPBPB10D8.07c zeigt eine hohe Korrelation zwischen TE-Änderungen des uORF und ORF (Pearson-Koeffizient = 0,99). (D) Übersetzung der SPBC1773.04 mRNA, die eine negative Korrelation zwischen uORF und ORF-TEs zeigte (Pearson-Koeffizient = -0,74). Beschriftung wie in (C).

Ergänzende Abbildung 4 Verbesserungen bei der Annotation des Spalthefe-Gens.

(A) Periodizitätsbewertungen trennen mRNA- und RPF-Daten. Verteilung der Periodizitäts-Scores in Frame Nummer 1 aller CDS für mRNA-Fragmente (blau) und RPFs (rot). Wir haben einen Schwellenwert von 0,6 gewählt, um neu entdeckte ORFs als translatiert zu definieren (Pfeil). Nur 0,1% der CDS im mRNA-Datensatz zeigen eine Periodizitätsbewertung über diesem Schwellenwert (in jedem Leseraster). Gene mit niedrigen Periodizitätswerten in den RPF-Daten werden möglicherweise falsch annotiert. Zum Beispiel, SPAC823.02 zeigt einen Periodizitäts-Score von 0,15 in Frame 1, aber eine deutliche Anreicherung in Frame 3 (0,70). (B) Translationsprofil von SPAC823.02. Die Heatmaps zeigen mRNA- und RPF-Spiegel über die Meiose hinweg, beginnend bei vegetativen Zellen und abwärts fortschreitend. Die Helligkeit der roten Farbe ist proportional zur gelesenen Zahl. Die Schemata zeigen die Position der UTRs (Linien) und des ORF (Boxen) für die vorgeschlagenen neuen Strukturen und die annotierten Modelle. Es wird vorhergesagt, dass die Translation in anderen Frames stattfindet als denen, die für beide Exons annotiert sind. (C) Translationsprofil von tom7, beschriftet wie in B. (D) Translationsprofil von pis1, beschriftet wie in B. In pis1 RPF-Daten zeigen die Existenz von zwei mRNA-Isoformen, die durch das Spleißen oder Zurückhalten eines Introns erzeugt wurden. Das Gen enthält zwei Spaltungs- und Polyadenylierungsstellen (P1 und P2), von denen sich eine innerhalb des Introns befindet, was darauf hindeutet, dass die Intronretention mit einer kürzeren mRNA assoziiert sein könnte. Die vorgeschlagenen Spleißmodelle wurden durch die Existenz von 'trans'-Reads validiert, die Exon-Exon-Übergänge (grüne Linie, Read 1) oder Exon-Intron-Übergänge (grüne Linie, Read 2) überspannten. Alle drei neuen vorhergesagten Proteine ​​(B-D) zeigten eine hohe Ähnlichkeit mit Proteinen anderer Schizosaccharomyces Spezies.

Ergänzende Abbildung 5 Polymorphismus des nup184 Gen und Translation neuer Gene.

A. Ausrichtung der 3'-Endsequenz des nup184 Gen von S. pombe, S. cryophilus und S. octosporus. Die S. pombe Referenzsequenz (aus der 972 Stunden- Stamm) enthält eine einzelne Nukleotiddeletion (gelb), die ein Stopcodon im Leserahmen (grün) erzeugt, das die Produktion des C-terminalen Teils des Nup184-Proteins verhindern sollte. B. Polymorphismen im nup184 Ort. Unsere Wildtyp-Sorte (968 h90) enthält an dieser Stelle (gelb) eine Einfügung eines C, das den Effekt der Löschung rückgängig macht. In dem pat1 diploid, ein Chromosom schien die Insertion zu haben, während das zweite die Deletion enthielt, die mit zwei stromaufwärts gelegenen Einzelnukleotidpolymorphismen (grün) verbunden ist. Die Translation stromabwärts des vorhergesagten Stopcodons findet in einem Raster statt, das mit dem Vorhandensein der Insertion übereinstimmt. (C) Längenverteilung von neuen translatierten Regionen (in Nukleotiden).

Ergänzende Abbildung 6 Beispiele für verschachtelte Antisense-Gene und überlappende uORFs.

(A) Übersetzung von spt16 Ort. Die Heatmaps zeigen mRNA- (oben) und RPF-Spiegel (unten) über den meiotischen Zeitverlauf, beginnend mit vegetativen Zellen oben und nach unten fortschreitend. Die oberen Graphen entsprechen dem Sense-Strang, die unteren dem Antisense-Strang. Die Helligkeit der roten Farbe ist proportional zur Anzahl der Lesevorgänge. Das Schema zeigt die Position der UTRs (Pfeile) und des ORF (Kästchen). LS entspricht dem lang annotierten Sense-Gen und AS der neuen translatierten Antisense-Codierungssequenz. (B) Triplett-Periodizität für die LS- und AS-Formen der spt16 Ort.Die Graphen zeigen den Anteil an Codons, in dem ein Großteil der Reads auf die Nukleotide 1, 2 oder 3 für die AS- und LS-ORFs abgebildet wird. (C) Übersetzung von SPCC1235.01 Ort. Die obere Grafik zeigt die Triplett-Periodizität über das Gen, die für ein laufendes Fenster von 35 Codons berechnet und als der Anteil der Codons mit einer Mehrheit der Reads in Nukleotid 1, 2 oder 3 innerhalb eines Codons dargestellt wird. Die Heatmaps sind wie in (A) beschriftet. L entspricht dem annotierten Gen und S den vorhergesagten überlappenden uORFs. Beachten Sie die Änderung des Leserahmens, wenn sich das Fenster von einem ORF zum nächsten bewegt. S überlappt mit L und wird stärker übersetzt und ist somit der dominante Frame. P1 und P2 repräsentieren Spaltungs- und Polyadenylierungsstellen. Die Tatsache, dass die 3'-Region des Gens eine geringere Anzahl von mRNA-Reads enthält und das Vorhandensein einer internen Spaltungsstelle (P1) legt die Existenz von zwei verschiedenen Isoformen des Gens nahe. (B) Übersetzung des SPAC6G9.05 Ort. Anmerkungen wie in (B).

Ergänzende Abbildung 7 Vollständige Scans für alle Western-Blots, die im Haupttext dargestellt sind.

Ergänzende Abbildung 8 Triplett-Periodizität von mRNA- und RPF-Reads.

(A) Balkendiagramme, die den Anteil der Reads anzeigen, bei denen Nukleotid 13 dem ersten, zweiten oder dritten Nukleotid innerhalb eines Codons entsprach, berechnet für alle Reads, die auf annotierte kodierende Sequenzen abgebildet wurden. Es werden nur Reads von genau 28 Nukleotiden gezeigt. Veg zeigt vegetativ wachsende Zellen an, und die Zeit zeigt die Anzahl der Stunden seit der Temperaturverschiebung an, um die Meiose zu induzieren. Die Daten für mRNA-Reads werden links angezeigt, die für RPFs rechts. (B) Wie in (A), aber die Reads wurden entsprechend ihrer Länge (von 25 bis 32 Nukleotiden) aufgeteilt und separat aufgetragen. Es werden nur Ablesungen des 1-stündigen meiotischen Zeitpunkts gezeigt, aber ähnliche Muster wurden für jede Probe erhalten. Beachten Sie die hohe Periodizität der Reads von 28 bis 30 Nukleotiden, die für die weitere Analyse ausgewählt wurden.


Gibt es Einschränkungen, wo Intron/Exon-Grenzen in Bezug auf die Triplett-Codons des Leserasters auftreten? - Biologie

Biologie Revision 34

Basenpaar
Zwei komplementäre Nukleotide in einem RNA- und einem DNA-Molekül, die durch Wasserstoffbrücken zusammengehalten werden.
Das Adenin – Thymin Basenpaar wird durch 2 Wasserstoffbrücken zusammengehalten, während das Guanin – Cytosin Basenpaar durch 3 Wasserstoffbrücken zusammengehalten wird. Das ist auch der Grund, warum sich die beiden Stränge eines DNA-Moleküls an dicht mit A – T-Basenpaaren besetzten Abschnitten leichter trennen lassen.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Zellzyklus
Die geordnete Abfolge von Ereignissen, durch die eine Zelle ihren Inhalt dupliziert und sich in zwei teilt.
Eine Zelle reproduziert sich, indem sie eine geordnete Abfolge von Ereignissen durchführt, in der sie ihren Inhalt dupliziert und sich dann in zwei Teile teilt. Dieser Zyklus der Vervielfältigung und Teilung, bekannt als Zellzyklus, ist der wesentliche Mechanismus, durch den sich alle Lebewesen fortpflanzen.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Zentromer
Eine spezialisierte DNA-Sequenz, die die Trennung duplizierter Chromosomen während der M-Phase ermöglicht, kann als die verengte Region eines mitotischen Chromosoms angesehen werden.
Das Zentromer ist die Chromosomenregion, die sich in der Metaphase der Mitose oder Meiose an eine Spindelfaser anlagert und sich in der Anaphase zum Spindelpol bewegt, wobei der Rest des Chromosoms dahinter gezogen wird. Es kann mikroskopisch oft in der Metaphase als dünne Einschnürung im ansonsten dicken kondensierten Chromosom und als Punkt, an dem das Chromosom flexibel und frei biegen kann, unterschieden werden.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Chromatin
Komplex aus DNA und Proteinen, aus dem die Chromosomen in einer eukaryontischen Zelle bestehen.
Chromatin ist ein Komplex aus DNA und Proteinen, der im Kern eukaryontischer Zellen Chromosomen bildet. Unter dem Mikroskop sieht Chromatin in seiner ausgedehnten Form aus wie Perlen an einer Schnur. Die Perlen werden Nukleosomen genannt. Jedes Nukleosom besteht aus DNA, die um acht Proteine ​​gewickelt ist, die Histone genannt werden.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Chromatin-Remodeling-Komplex
Enzym, das die Energie der ATP-Hydrolyse nutzt, um die Anordnung von Nukleosomen in eukaryontischen Chromosomen zu verändern, wodurch die Zugänglichkeit der zugrunde liegenden DNA für andere Proteine, einschließlich derjenigen, die an der Transkription beteiligt sind, verändert wird.
Chromatin-Remodeling, eine wichtige Facette der Regulation der Genexpression in Eukaryoten, wird von zwei Haupttypen von Multisubunit-Komplexen durchgeführt, kovalenten Histon- oder DNA-modifizierenden Komplexen und ATP-abhängigen Chromosomen-Remodeling-Komplexen.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Chromosom
Eine lange, fadenförmige Struktur aus DNA und Proteinen, die die genetische Information eines Organismus trägt, wird als eigenständige Einheit sichtbar, wenn sich eine Pflanzen- oder Tierzelle auf die Teilung vorbereitet.
Der Mensch hat ein zusätzliches Paar Geschlechtschromosomen für insgesamt 46 Chromosomen. Die Geschlechtschromosomen werden als X und Y bezeichnet und ihre Kombination bestimmt das Geschlecht einer Person. Typischerweise haben menschliche Frauen zwei X-Chromosomen, während Männer eine XY-Paarung besitzen. Dieses XY-Geschlechtsbestimmungssystem findet sich bei den meisten Säugetieren sowie einigen Reptilien und Pflanzen.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Komplementär
Beschreibt zwei molekulare Oberflächen, die eng zusammenpassen und nichtkovalente Bindungen miteinander eingehen.
Die chemischen Moleküle, aus denen die DNA besteht, werden als Nukleotidbasen bezeichnet. Es gibt vier gängige Basentypen: Adenin (A), Cytosin (C), Guanin (G) und Thymin (T). Bei der chemischen „Schloss-und-Schlüssel“-Passung paart sich ein A auf einem Strang immer mit einem T auf dem anderen Strang. Außerdem paart sich ein C auf einem Strang immer mit einem G auf dem anderen Strang. Die beiden Stränge werden als zueinander komplementär beschrieben.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Desoxyribonukleinsäure (DNA)
Doppelsträngiges Polynukleotid, gebildet aus zwei getrennten Ketten kovalent verknüpfter Desoxyribonukleotid-Einheiten. Es dient als Speicher der Zelle für genetische Informationen, die von Generation zu Generation weitergegeben werden.
Jedes Nukleotid besteht aus drei Komponenten:
• eine stickstoffhaltige Base: Cytosin (C), Guanin (G), Adenin (A) oder Thymin (T)
• ein Zuckermolekül mit fünf Kohlenstoffatomen (Desoxyribose im Fall von DNA)
• ein Phosphatmolekül
• Das Rückgrat des Polynukleotids ist eine Kette von Zucker- und Phosphatmolekülen. Jede der Zuckergruppen in diesem Zucker-Phosphat-Rückgrat ist an eine der vier stickstoffhaltigen Basen gebunden.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Doppelhelix
Die typische Struktur eines DNA-Moleküls, bei der die beiden komplementären Polynukleotidstränge mit Basenpaarung zwischen den Strängen umeinander gewunden sind.
DNA-Struktur DNA besteht aus Molekülen, die als Nukleotide bezeichnet werden. Jedes Nukleotid enthält eine Phosphatgruppe, eine Zuckergruppe und eine Stickstoffbase. Die vier Arten von Stickstoffbasen sind Adenin (A), Thymin (T), Guanin (G) und Cytosin (C). Die Reihenfolge dieser Basen bestimmt die Anweisungen der DNA oder den genetischen Code.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Euchromatin
Einer der beiden Hauptzustände, in denen Chromatin in einer Interphase-Zelle existiert. Vorherrschend in genreichen Gebieten, ermöglicht seine weniger kompakte Struktur den Zugang für Proteine, die an der Transkription beteiligt sind.
Die Euchromatin-Struktur enthält oft unmethylierte Exons des ersten Gens. Histonmodifikationen, die mit aktiver Transkription verbunden sind, umfassen Lysinacetylierung und Methylierung. Typischerweise erfolgt die Histonacetylierung an mehreren Lysinresten, am häufigsten an den Histonen H3 und H4, und wird normalerweise von einer Vielzahl von Histonacetyltransferase-Komplexen (HATs) durchgeführt (Brown et al. 2000 Schüttengruber et al. 2007).
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Gen
Vererbungseinheit, die die Anweisungen enthält, die die Eigenschaften oder den Phänotyp eines Organismus in molekularer Hinsicht bestimmen, ein DNA-Segment, das die Produktion eines Proteins oder eines funktionellen RNA-Moleküls steuert.
Ein Gen ist die grundlegende physikalische und funktionelle Einheit der Vererbung. Gene bestehen aus DNA. Einige Gene fungieren als Anweisungen, um Moleküle herzustellen, die Proteine ​​genannt werden. Viele Gene kodieren jedoch nicht für Proteine. Beim Menschen variieren die Größe der Gene von einigen hundert DNA-Basen bis zu mehr als 2 Millionen Basen.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Genexpression
Der Prozess, durch den ein Gen ein Produkt herstellt, das für die Zelle oder den Organismus nützlich ist, indem es die Synthese eines Proteins oder eines RNA-Moleküls mit einer charakteristischen Aktivität steuert.
Mehrere Schritte im Genexpressionsprozess können moduliert werden, einschließlich der Transkription, des RNA-Spleißens, der Translation und der posttranslationalen Modifikation eines Proteins. Die Genregulation gibt der Zelle die Kontrolle über Struktur und Funktion und ist die Grundlage für zelluläre Differenzierung, Morphogenese und die Vielseitigkeit und Anpassungsfähigkeit jedes Organismus.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Genetischer Code
Regelwerk, nach dem die in der Nukleotidsequenz eines Gens und seines entsprechenden RNA-Moleküls enthaltene Information in die Aminosäuresequenz eines Proteins übersetzt wird.
Bei der Translation wird eine mRNA-Sequenz anhand des genetischen Codes gelesen, einem Regelwerk, das definiert, wie eine mRNA-Sequenz in den 20-Buchstaben-Code von Aminosäuren, den Bausteinen von Proteinen, übersetzt werden soll.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Genom
Die gesamte genetische Information, die von allen Chromosomen einer Zelle oder eines Organismus getragen wird.
Das Genom ist das gesamte genetische Material eines Organismus. Es befindet sich im Zellkern und besteht aus einer Chemikalie namens DNA. Die Untersuchung der Struktur und Funktion des Genoms wird Genomik genannt.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Heterochromatin
Hochkondensierter Bereich eines Interphase-Chromosoms im Allgemeinen genarm und transkriptionell inaktiv.
Kompakte und hochkondensierte Form von Chromatin. Heterochromatin ist eine dicht gepackte Form von DNA oder kondensierter DNA, die in mehreren Varianten vorkommt. Diese Varietäten liegen auf einem Kontinuum zwischen den beiden Extremen des konstitutiven Heterochromatins und des fakultativen Heterochromatins.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Histon
Eines aus einer Gruppe von reichlich konservierten Proteinen, um die sich DNA wickelt, um Nukleosomen zu bilden, Strukturen, die die grundlegendste Ebene der Chromatinpackung darstellen.
Chromatin besteht aus der DNA einer Zelle und assoziierten Proteinen. Histon-Proteine ​​und DNA werden in eukaryotischem Chromatin in ungefähr gleicher Masse gefunden, und auch Nicht-Histon-Proteine ​​sind in großer Menge vorhanden. Die grundlegende Organisationseinheit von Chromatin ist das Nukleosom, eine Struktur aus DNA und Histonproteinen, die sich im gesamten genetischen Material eines Organismus wiederholt.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Karyotyp
Eine geordnete Darstellung des vollständigen Chromosomensatzes einer Zelle, geordnet nach Größe, Form und Anzahl.
Ein Karyotyp ist die Anzahl und das Aussehen von Chromosomen und umfasst deren Länge, Streifenmuster und Zentromerposition. Um einen Überblick über den Karyotyp einer Person zu erhalten, fotografieren Zytologen die Chromosomen und schneiden dann jedes Chromosom aus und fügen es in ein Diagramm oder Karyogramm, auch bekannt als Ideogramm, ein
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Nukleolus
Große Struktur innerhalb des Kerns, in der ribosomale RNA transkribiert und ribosomale Untereinheiten zusammengesetzt werden.
Der Nukleolus ist eine ausgeprägte Struktur im Zellkern, die aus filamentösem und körnigem Material besteht. Es ist der Ort der Synthese und Verarbeitung ribosomaler RNA und des Zusammenbaus dieser RNA mit ribosomalen Proteinen zu ribosomalen Untereinheiten.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Replikationsursprung
Nukleotidsequenz, bei der die DNA-Replikation initiiert wird.
Die DNA-Replikation beginnt an einem einzigen Replikationsursprung, und die beiden dort zusammengebauten Replikationsgabeln laufen (mit etwa 500–1000 Nukleotiden pro Sekunde) in entgegengesetzte Richtungen, bis sie sich ungefähr auf halber Höhe des Chromosoms treffen
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Telomer-Gen
Repetitive Nukleotidsequenz, die die Enden von linearen Chromosomen abdeckt. Wirkt der Tendenz des Chromosoms entgegen, sich sonst mit jeder Replikationsrunde zu verkürzen.
Andernfalls könnten Zellen im Zellzyklus dauerhaft zum Stillstand kommen, und Versuche, die Chromosomenenden zu „reparieren“, hätten verheerende Folgen für die Integrität des Genoms. Dieses Problem des Endschutzes wird durch Protein-DNA-Komplexe, die Telomere genannt werden, gelöst.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Krebs
Krankheit, die durch abnormale und unkontrollierte Zellproliferation verursacht wird, gefolgt von Invasion und Kolonisierung von Körperstellen, die normalerweise für andere Zellen reserviert sind.
Die Proteine, die an der Regulierung von Zellteilungsereignissen beteiligt sind, treiben das Fortschreiten von einem Zellzyklusstadium zum nächsten nicht mehr angemessen voran. Anstatt keine Funktion zu verlieren, vermehren sich Krebszellen mit einer Geschwindigkeit, die weit über die normalerweise streng regulierten Grenzen des Zellzyklus hinausgeht. Krebs kann von vielen anderen menschlichen Krankheiten unterschieden werden, da seine Ursache nicht in einer fehlenden oder verminderten Zellfunktion liegt.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

DNA-Ligase
Ein Enzym, das im Labor entstandene Kerben im Rückgrat eines DNA-Moleküls wieder versiegelt, kann verwendet werden, um zwei DNA-Fragmente zusammenzufügen.
DNA-Ligasen sind am besten bekannt für ihre Rolle beim Verbinden benachbarter Okazaki-Fragmente am nacheilenden Strang der Replikationsgabel, sie sind jedoch im Wesentlichen an jedem Prozess beteiligt, der das Abdichten von Phosphodiesterbindungen vom DNA-Rückgrat erfordert. Ligasen katalysieren die Bildung von Phosphodiesterbindungen zwischen 3'OH und 5'Phosphat auf verschiedenen Substraten wie DNA-Nicks, DNA-Fragmenten mit unterschiedlich langen kohäsiven Enden, DNA-Fragmenten mit glatten Enden und einigen.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Polymerase
Allgemeiner Begriff für ein Enzym, das die Addition von Untereinheiten an ein Nukleinsäurepolymer katalysiert.
Die Replikation genomischer DNA ist die Hauptfunktion von DNA-Polymerasen. Sobald die DNA genau dupliziert ist, kann sich die Zelle teilen, wobei jede Tochterzelle den vollständigen genetischen Code des Organismus erhält. Polymerasen, die für die DNA-Replikation verantwortlich sind, sind komplexe Multiprotein-Maschinen, die DNA mit hoher Geschwindigkeit, Prozessivität und Genauigkeit synthetisieren können.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

DNA-Reparatur
Sammelbegriff für die enzymatischen Prozesse, die schädliche Veränderungen korrigieren, die die Kontinuität oder Sequenz eines DNA-Moleküls beeinflussen.
DNA-Reparatur kann in eine Reihe von Mechanismen unterteilt werden, die Schäden in DNA-Molekülen identifizieren und korrigieren. Es gibt zwei allgemeine Klassen der DNA-Reparatur, die direkte Umkehrung des chemischen Prozesses, der den Schaden erzeugt, und den Ersatz beschädigter Nukleotidbasen.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

DNA Replikation
Der Prozess, bei dem eine Kopie eines DNA-Moleküls hergestellt wird.
Replikation ist der Prozess, bei dem ein doppelsträngiges DNA-Molekül kopiert wird, um zwei identische DNA-Moleküle zu produzieren. Die DNA-Replikation ist einer der grundlegendsten Prozesse, die innerhalb einer Zelle ablaufen. Jedes Mal, wenn sich eine Zelle teilt, müssen die beiden resultierenden Tochterzellen genau die gleiche genetische Information oder DNA wie die Mutterzelle enthalten. Um dies zu erreichen, fungiert jeder Strang vorhandener DNA als Matrize für die Replikation.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Homologe Rekombination
Der Mechanismus, mit dem Doppelstrangbrüche in einem DNA-Molekül fehlerfrei repariert werden können, verwendet ein unbeschädigtes, dupliziertes oder homologes Chromosom, um die Reparatur zu steuern. Während der Meiose führt der Mechanismus zu einem Austausch genetischer Informationen zwischen den mütterlichen und väterlichen Homologen.
Die homologe Rekombination ist ein wichtiger Weg, der an der Reparatur von doppelsträngigen DNA-Brüchen beteiligt ist. Genetische Studien bilden die Grundlage unseres Wissens zur homologen Rekombination. Auch beim Verständnis der biochemischen und biophysikalischen Eigenschaften der Proteine, Komplexe und Reaktionszwischenstufen, die an diesem essentiellen DNA-Reparaturweg beteiligt sind, wurden bedeutende Fortschritte erzielt.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Nachlaufender Strang
An einer Replikationsgabel wird der DNA-Strang diskontinuierlich in kurzen separaten Fragmenten hergestellt, die später zusammengefügt werden, um einen kontinuierlichen neuen Strang zu bilden.
Ein nacheilender Strang ist einer von zwei DNA-Strängen, die sich an der Replikationsgabel oder Verbindungsstelle in der Doppelhelix befinden, der andere Strang wird als führender Strang bezeichnet. Ein nachlaufender Strang erfordert eine leichte Verzögerung, bevor er repliziert wird, und er muss diskontinuierlich in kleinen Fragmenten repliziert werden.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Leitstrang
An einer Replikationsgabel der DNA-Strang, der durch kontinuierliche Synthese in 5′-3′-Richtung hergestellt wird.
Dieser kontinuierlich synthetisierte Strang wird als Leitstrang bezeichnet. Da die DNA-Polymerase DNA nur in 5′ bis 3′-Richtung synthetisieren kann, wird der andere neue Strang in kurzen Stücken, den sogenannten Okazaki-Fragmenten, zusammengesetzt. Die Okazaki-Fragmente benötigen jeweils einen Primer aus RNA, um die Synthese zu starten.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Reparatur von Fehlanpassungen
Mechanismus zum Erkennen und Korrigieren falsch gepaarter Nukleotide – also solcher, die nicht komplementär sind.
DNA Mismatch Repair (MMR) erkennt und repariert fehlerhafte Insertion, Deletion und Fehleinbau von Basen, die während der DNA-Replikation und -Rekombination auftreten können, und repariert einige Formen von DNA-Schäden. Es spielt eine wichtige Rolle bei der Aufrechterhaltung der genomischen Stabilität und der zellulären Homöostase. MMR erhöht beispielsweise die Genauigkeit der DNA-Replikation in Escherichia coli um das 20- bis 400-fache.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Mutation
Eine zufällig erzeugte, dauerhafte Veränderung der Nukleotidsequenz der DNA.
Suchergebnisse
Eine Genmutation ist eine dauerhafte Veränderung der DNA-Sequenz, aus der ein Gen besteht, so dass sich die Sequenz von derjenigen unterscheidet, die bei den meisten Menschen gefunden wird. Mutationen können in der Größe variieren, von einem einzelnen DNA-Baustein (Basenpaar) bis hin zu einem großen Segment eines Chromosoms, das mehrere Gene enthält.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Nichthomologe Endverbindung
Ein Quick-and-Dirty-Mechanismus zur Reparatur von Doppelstrangbrüchen in der DNA, bei dem die beiden gebrochenen Enden schnell zusammengeführt, gekürzt und wieder zusammengefügt werden, führt zu einem Informationsverlust an der Reparaturstelle.
Nonhomologes End Joining (NHEJ) ist ein Reparaturmechanismus, der gebrochene Enden von DNA-DSBs direkt unter Verwendung eines heterodimeren Enzymkomplexes ligiert, der aus den Proteinen Ku-70 und Ku-80, der katalytischen Untereinheit der DNA-Proteinkinase (DNA-PKCS) und XRCC4 . besteht /Ligase IV.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Okazaki-Fragment
Kurze DNA-Länge, die während der DNA-Replikation auf dem nacheilenden Strang produziert wird. Benachbarte Fragmente werden durch DNA-Ligase schnell miteinander verbunden, um einen kontinuierlichen DNA-Strang zu bilden.
Die Synthese des nacheilenden Strangs erfolgt diskontinuierlich. Okazaki-Fragmente werden durch die Erzeugung eines neuen RNA-Primers durch das Primosom initiiert. Um die DNA-Synthese neu zu starten, löst der DNA-Clamp-Loader den nacheilenden Strang von der Gleitklemme und befestigt dann die Klemme wieder am neuen RNA-Primer. Dann kann DNA-Polymerase III das DNA-Segment synthetisieren.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Primas
Eine RNA-Polymerase, die DNA als Matrize verwendet, um ein RNA-Fragment herzustellen, das als Primer für die DNA-Synthese dient.

Primase ist der Name, der dem Enzym gegeben wurde, das RNA-Primer synthetisiert. Primer sind Oligonukleotide, die komplementär an eine DNA-Matrize gebunden sind und von denen DNA-Polymerasen ausgehen. Spezielle Proteine ​​sind dafür verantwortlich, Primase am Replikationsursprung zu laden, damit die DNA-Synthese des führenden Strangs beginnen kann. In einem nachfolgenden Schritt veranlassen andere Replikationsproteine ​​Primase, die DNA-Replikation auf dem gegenüberliegenden nacheilenden Strang zu initiieren.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Korrekturlesen
Der Prozess, durch den die DNA-Polymerase ihre eigenen Fehler korrigiert, während sie sich entlang der DNA bewegt.
DNA-Polymerase fungiert als „selbstkorrigierendes“ Enzym, das seine eigenen Polymerisationsfehler beseitigt, während es sich entlang der DNA bewegt.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Replikationsgabel
Y-förmige Verbindung, die sich an der Stelle bildet, an der die DNA repliziert wird.
Die doppelsträngige DNA des zirkulären Bakterienchromosoms wird am Replikationsursprung geöffnet und bildet eine Replikationsblase. Jedes Ende der Blase ist eine Replikationsgabel, eine Y-förmige Verbindung, an der doppelsträngige DNA in zwei Einzelstränge getrennt wird.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Replikationsursprung
Nukleotidsequenz, bei der die DNA-Replikation initiiert wird.
Die DNA-Replikation beginnt an einem einzigen Replikationsursprung, und die beiden dort zusammengebauten Replikationsgabeln laufen (mit etwa 500–1000 Nukleotiden pro Sekunde) in entgegengesetzte Richtungen, bis sie sich ungefähr auf halber Höhe des Chromosoms treffen
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Ribonukleinsäure (RNA)
Molekül, das durch die Transkription von DNA normalerweise einzelsträngig produziert wird, ist ein Polynukleotid, das aus kovalent verknüpften Ribonukleotid-Untereinheiten besteht. Dient einer Vielzahl von strukturellen, katalytischen und regulatorischen Funktionen in Zellen.
Ribonukleinsäure (RNA) ist ein DNA-ähnliches Molekül. Im Gegensatz zur DNA ist RNA einzelsträngig. Ein RNA-Strang hat ein Rückgrat aus abwechselnden Zucker- (Ribose) und Phosphatgruppen. An jeden Zucker ist eine von vier Basen gebunden – Adenin (A), Uracil (U), Cytosin (C) oder Guanin (G).
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Telomerase
Enzym, das Telomere verlängert und die sich wiederholenden Nukleotidsequenzen synthetisiert, die an den Enden eukaryontischer Chromosomen gefunden werden.
Telomerase. Einige Zellen haben die Fähigkeit, die Telomerverkürzung umzukehren, indem sie Telomerase exprimieren, ein Enzym, das die Telomere von Chromosomen verlängert. Telomerase ist eine RNA-abhängige DNA-Polymerase, d. h. ein Enzym, das DNA mit RNA als Matrize herstellen kann.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Vorlage
Eine molekulare Struktur, die als Muster für die Produktion anderer Moleküle dient. Zum Beispiel steuert ein DNA-Strang die Synthese des komplementären DNA-Strangs.
Aus Zellen isolierte DNA-Polymerasen und künstliche DNA-Primer können verwendet werden, um die DNA-Synthese an bekannten Sequenzen in einem DNA-Matrizenmolekül zu starten.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Epigenetische Vererbung
Die Untersuchung von Mechanismen, die die Genexpression steuern, die von der DNA-Sequenz selbst unabhängig sind.
Epigenetische Mechanismen umfassen DNA-Methylierung, Histon-Modifikationen und nicht-kodierende Ribonukleinsäure-Regulierung. Zusammenfassend bestimmen epigenetische Mechanismen die Chromatinarchitektur, die Zugänglichkeit genetischer Loci für die Transkriptionsmaschinerie und das Ausmaß der Genexpression.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Mobiles genetisches Element
Ein kurzes DNA-Segment, das sich, manchmal über ein RNA-Zwischenprodukt, von einer Stelle in einem Genom zu einer anderen bewegen kann, eine wichtige Quelle genetischer Variation in den meisten Genomen.
Beispiele für mobile genetische Elemente (MGE) und Prozesse, die an der intrazellulären Mobilität oder dem interzellulären Transfer von Antibiotikaresistenzgenen beteiligt sind.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Transposon
Allgemeiner Name für kurze DNA-Abschnitte, die sich im Genom von einem Ort zum anderen bewegen können.
Seit McClintocks Entdeckung wurden drei Grundtypen von Transposons identifiziert. Diese umfassen Transposons der Klasse II, transponierbare Miniaturelemente mit umgekehrter Wiederholung (MITEs oder Transposons der Klasse III) und Retrotransposons (Transposons der Klasse I).
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Zurückotransposon
Retrotransposon ist eine Art von transponierbarem Element, das sich bewegt, indem es zuerst in eine RNA-Kopie transkribiert wird, die dann durch reverse Transkriptase wieder in DNA umgewandelt und an anderer Stelle im Chromosom eingefügt wird.
Retrotransposons bewegen sich ebenfalls nach einem „Copy-and-Paste“-Mechanismus, aber im Gegensatz zu den oben beschriebenen Transposons besteht die Kopie aus RNA, nicht aus DNA.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Retrovirus
RNA-haltiges Virus, das sich in einer Zelle repliziert, indem es zunächst ein doppelsträngiges DNA-Zwischenprodukt herstellt, das in das Chromosom der Zelle integriert wird
In einer doppelsträngigen RNA-Form infizieren Retroviren eine Wirtszelle mit ihrem Genom und werden dann in doppelsträngige DNA revers transkribiert, wobei die DNA dann in das Genom der Heimatzelle integriert wird.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Umgekehrte Transkriptase
Enzym, das eine doppelsträngige DNA-Kopie von einem einzelsträngigen RNA-Matrizenmolekül herstellt. Vorkommen in Retroviren und als Teil der Transpositionsmaschinerie von Retrotransposons.
Reverse Transkriptase ist eine RNA-abhängige DNA-Polymerase, die 1970 in vielen Retroviren wie dem humanen Immunschwächevirus (HIV) und dem aviären Myeloblastosevirus (AMV) entdeckt wurde. Reverse Transkriptasen werden häufig verwendet, um komplementäre DNA (cDNA)-Bibliotheken aus verschiedenen exprimierten mRNAs herzustellen und werden auch verwendet, um das Niveau der mRNA-Synthese zu quantifizieren, wenn sie mit der Polymerase-Kettenreaktionstechnik, genannt RT-PCR, kombiniert werden. Reverse Transkriptase enthält drei enzymatische Aktivitäten: (1) RNA-abhängige DNA-Polymerase, (2) RNase H und (3) DNA-abhängige DNA-Polymerase.
Referenz: Molekularbiologie. Academic Cell Update Edition. Buch • 2. Auflage • 2013

Alternatives Spleißen
Die Produktion verschiedener mRNAs (und Proteine) aus demselben Gen durch unterschiedliche Spleißen seiner RNA-Transkripte.
Alternatives Spleißen (AS) ist ein Verfahren, durch das Exons entweder ausgeschlossen oder in oder von einer Prä-mRNA eingeschlossen werden können, was zu mehreren mRNA-Isoformen führt. Es spielt eine entscheidende Rolle bei der Regulation der Genexpression und Proteindiversität in einer Vielzahl von Eukaryoten. Beim Menschen werden etwa 95 % der Multi-Exon-Gene einem alternativen Spleißen unterzogen.
Aus: Methoden der Enzymologie, 2013


Hintergrund

Viele Gene in tierischen und pflanzlichen Genomen exprimieren mehr als ein Transkript durch alternatives Spleißen. Diese Transkripte können Proteine ​​mit unterschiedlichen, manchmal sogar antagonistischen Funktionen kodieren. Zum Beispiel exprimieren viele Mitglieder der humanen Caspase-Genfamilie alternative Spleißvarianten, die für pro- und anti-apoptotische Proteine ​​kodieren [1]. Bei Säugetieren überspringen die meisten alternativen Spleißereignisse vollständige Exons oder verwenden entweder alternative Donor- oder Akzeptor-Spleißstellenpaare. Die meisten letzteren (im Folgenden als Tandem-Spleißstellen bezeichnet) befinden sich in unmittelbarer Nähe [2-6], was zur Insertion/Deletion (Indel) von nur wenigen Nukleotiden führt. Alternative Spleißereignisse bei NAGNAG-Akzeptoren sind die häufigsten dieser Ereignisse. Frühere Studien legen nahe, dass der Spleißmechanismus von Tandemstellen mit kurzer Distanz eine stochastische Auswahl einer der beiden Stellen beinhaltet [7]. Eine Teilmenge dieser Ereignisse steht unter reinigender Selektion und trägt somit zum Repertoire biologisch relevanter alternativer Spleißereignisse bei [8].

Beim Menschen verschiebt eine beträchtliche Anzahl alternativer Spleißereignisse entweder den Proteinleserahmen oder führt direkt ein vorzeitiges Terminationscodon durch Überspringen von Exons oder alternative Verwendung von Tandem-Spleißstellen ein [3,9-11]. Die meisten dieser Ereignisse machen das Transkript zu einem Ziel für den Nonsense-vermittelten mRNA-Zerfall (NMD) [11]. Die Konservierung solcher Ereignisse impliziert Funktionalität, möglicherweise durch Regulierung des Proteinspiegels [8,12-14]. Andererseits haben viele dieser Ereignisse wahrscheinlich keine funktionelle Relevanz oder können auf Spleißfehler zurückzuführen sein [15]. Hier ist NMD ein wichtiger Überwachungsmechanismus, der die Menge an Transkripten reduziert, die in verkürzte Proteine ​​übersetzt werden würden [16].

Abgesehen von NMD können Zellen die komplexen regulatorischen Spleißmechanismen nutzen, um schädliche Spleißereignisse zum Schweigen zu bringen. Beispielsweise sind Pseudo-Exons (stille intronische Regionen, die echten Exons ähneln) an Bindungsstellen für stumme Spleißfaktoren angereichert, die ihren Einbau in das reife Transkript verhindern [17]. Ebenso hemmen Silencer-Motive, die sich zwischen zwei alternativen Spleißstellen befinden, die Verwendung einer Spleißstelle [18]. Somit ermöglichen Hilfsspleißverstärker- und Schalldämpfersignale eine hohe Spleißgenauigkeit trotz des Auftretens zahlreicher Pseudospleißstellen. Folglich scheint es im Laufe der Evolution nicht nötig gewesen zu sein, all diese Pseudospleißstellen loszuwerden.

Diese Situation ist für schädliche Kurzstrecken-Tandemspleißstellen, die den Leserahmen erhalten, anders. Erstens lösen sie keine NMD aus und zweitens scheinen die Mechanismen zur Hemmung der Verwendung der alternativen Spleißstelle begrenzt zu sein. Der letztere Grund ist auf räumliche Beschränkungen zurückzuführen, die es nicht erlauben, Spleiß-Silencer-Motive zwischen zwei Spleißstellen zu platzieren, die durch nur 3 Nukleotide (nt) getrennt sind.

Darüber hinaus sind wahrscheinlich die Kernkomponenten des Spleißosoms die Hauptfaktoren, die solche alternativen Spleißereignisse ermöglichen, während andere Spleißereignisse oft von zusätzlichen verstärkenden und/oder stummmachenden Spleißfaktoren abhängen. Dies macht Tandemspleißereignisse ziemlich unabhängig von gewebespezifischen Schwankungen der Spleißfaktorkonzentrationen. Konsequenterweise erzeugen viele Tandemstellen konstante Spleißvariantenverhältnisse [19-21], obwohl in mehreren Fällen Variationen des Verhältnisses beobachtet wurden [4,20,22-24]. Unter der Annahme, dass regulatorische Spleißmechanismen im Allgemeinen alternatives Spleißen an diesen Stellen nicht vollständig verhindern können, besteht die ultimative Möglichkeit, ein schädliches Tandem-Spleißereignis zu beseitigen, darin, die Tandem-Stelle zu zerstören, beispielsweise durch eine Mutation, die einen GT/GC-Donor oder einen AG zerstört Akzeptordinukleotid. Unter dieser Annahme würden wir erwarten, Spuren natürlicher Selektion zu finden, die sich als Unterrepräsentation von Tandem-Spleißstellen an Orten, an denen sie schädlich sind, zeigen.

Um diese Hypothese zu testen, analysierten wir Frame-erhaltende Tandem-Spleißstellen mit einem Abstand von 3, 6 und 9 nt (㥃, 㥆 bzw. 㥉 nt). Wir haben uns auf kurze Distanzen konzentriert, da wahrscheinlich ein stochastischer Spleißmechanismus die Grundlage für solche alternativen Spleißereignisse ist [7]. Wir präsentieren mehrere Beweislinien dafür, dass solche Tandemstellen in proteinkodierenden Sequenzen (CDS) unterrepräsentiert sind, und insbesondere in Regionen, die geordnete 3D-Proteinstrukturen bilden. Wir schätzen das

2.400 Introns werden gegen den Besitz einer Tandemstelle selektiert.


Einführung

Das Verständnis der Beziehung zwischen Genotyp und Phänotyp ist ein Schlüsselthema in den Biowissenschaften mit enormen Auswirkungen auf die biomedizinische Forschung und Entwicklung, das Gesundheitswesen und die Landwirtschaft. Die angeborene genetische Variabilität ist sowohl die Quelle als auch die Folge der Selektion in Populationen von Menschen, Nutzpflanzen und Tieren. Es besteht ein feines Gleichgewicht zwischen der Variabilität der DNA-Sequenzen und den evolutionären Zwängen für die Erhaltung des ursprünglichen Zustands oder die Fixierung einer neuen Variante mit einem selektiven Vorteil. Die meisten genetischen Varianten treten als Einzelnukleotidpolymorphismen (SNPs) und kleine Insertionen und Deletionen (Indels) auf. In eukaryotischen Genomen sind die Variantenverteilung und die Rate spontaner Mutationen über die einzelnen Stellen hinweg nicht einheitlich 1,2 . Stattdessen hängen sie vom funktionellen Einfluss von Varianten entweder auf die Proteinstruktur oder die RNA-Struktur in den regulatorischen Regionen ab, die die Transkription beeinflussen. Somit verkürzt ein SNP, der ein vorzeitiges Stoppcodon verursacht, eine Proteinsequenz, die phänotypisch signifikant sein kann. Es überrascht nicht, dass die genetische Variabilität in proteinkodierenden Regionen zwei- bis dreimal niedriger ist als in intergenischen Regionen 2,3,4,5. In ähnlicher Weise sind Promotorregionen (und insbesondere die Sequenzen innerhalb von Transkriptionsfaktor-Bindungsstellen, TFBS) weniger anfällig für SNPs und Indels als intergenische Regionen, wobei das Ausmaß der Sequenzvariation innerhalb und um TFBSs von ihrer Positionsgewichtsmatrix abgeleitet wird 6 . Die genetische Variabilität kann auch aus evolutionärer Sicht bewertet werden, indem eine Kombination aus phylogenetischen und populationsgenetischen Techniken verwendet wird 7 . So wurden durch die Analyse einer Population von 34 . mutationsbedingte „heiße“ und „kalte“ Stellen entdeckt E coli Stämme 7. Eine niedrigere Mutationsrate wurde bei stark exprimierten Genen und bei solchen beobachtet, die einer stärkeren reinigenden Selektion unterzogen wurden, die die Retention schädlicher Mutationen reduziert 7 . In einer anderen Veröffentlichung wurden Mutations-Hotspots mit den Regionen des offenen Chromatins in Säugetiergenomen verbunden 8 . Sowohl in normalen als auch in Krebsgeweben wurden Mutationsraten in Zusammenhang mit epigenetischen Merkmalen wie DNA-Methylierung und Nukleosomenbelegung gefunden 9,10, wobei eine unverhältnismäßig höhere Anzahl von SNPs in unterschiedlich methylierten DNA-Regionen auftritt 11 . Es wurde auch festgestellt, dass die Nukleotidzusammensetzung ein wichtiger Faktor bei der SNP-Verteilung ist 12,13,14,15, mit einer quadratischen Abhängigkeit der SNP-Dichte vom GC-Gehalt 12,13. Die Methylierung von Cytosinen in Regionen mit hohem GC führt zu einer lokal erhöhten SNP-Dichte 16 . Eine hohe SNP-Dichte ist auch für Regionen mit niedriger GC charakteristisch, die typischerweise in Heterochromatin verpackt sind und häufig als „Genwüsten“ bezeichnet werden 8 . Im feineren Maßstab weisen 5'- und 3'-untranslatierte Regionen von Protein-kodierenden Genen (UTRs) konservierte Regionen auf, wie durch die Analyse von Mustern der Sequenzkonservierung in Hefe und Säugetieren gezeigt wurde 17 . In einigen Fällen ist die SNP-Dichte in diesen Regionen sogar niedriger als in den entsprechenden kodierenden Regionen 18 . Konservierte Bereiche von UTRs enthalten Bindungsstellen für Proteine ​​oder Antisense-RNAs, die den Transport, die RNA-Stabilität, die zelluläre Lokalisation, das Expressionsniveau und die Translation modulieren 17 . Schließlich neigen die gleichen Nukleotidpositionen dazu, sowohl zwischen Organismen als auch innerhalb von Organismen konserviert zu werden, wie durch die speziesübergreifende Analyse der SNP-Verteilung in funktionell wichtigen Regionen bei Mäusen und Menschen festgestellt wurde 19 .

Die meisten Studien zur genomischen Variabilität wurden an Säugern und Hefen durchgeführt 17,18,19 , wobei Pflanzen viel weniger Beachtung geschenkt wurde 20,21,22,23,24,25 . Die Analyse der genomischen Variation in Reis wurde kürzlich von McCouch . vorgestellt et al. 26 (1.568 verschiedene Inzuchtreissorten, analysiert mit 700.000 SNPs), Huang et al. 27 (Reisdomestikationsanalyse basierend auf 1.083 kultivierten Indica- und Japonica-Sorten), Xu et al. 28 (Resequenzierung von 50 Akzessionen bei >15 × Rohabdeckung), Duitama et al. 29 (Sequenzierung und bioinformatische Analysen von 104 Reissorten der wichtigsten Unterarten von Oryza sativa), Arai-Kichise et al. 30 (Analyse von SNP in sieben Reissorten der gemäßigten und tropischen Japonica), Jain et al. 2 (Gesamtgenom-Resequenzierung von drei Reissorten mit kontrastierenden Reaktionen auf Trockenheit und Salzgehaltsstress).

Das Verständnis der DNA-Variabilität bei Pflanzen ist enorm wichtig, da Nutzpflanzen das Herzstück der weltweiten Landwirtschaft sind. Es wird prognostiziert, dass sich der Nahrungsmittelverbrauch innerhalb der nächsten 35 Jahre verdoppeln wird, was sich in der Nachfrage nach 2%igen jährlichen Ertragswachstumsraten für wichtige Nutzpflanzen niederschlägt. Die derzeitigen Züchtungs- und Selektionsmethoden, einschließlich der transgenen Technologie, können jedoch nur eine durchschnittliche jährliche Wachstumsrate von 1,1 % unterstützen 31 . Reis ist das wichtigste Getreide für die Mehrheit der Weltbevölkerung, insbesondere in Asien und Afrika. Der Klimawandel und der zunehmende Mangel an landwirtschaftlichen Flächen stellen die Reisproduktion vor weitere Herausforderungen. Um die erforderliche Steigerung der weltweiten Produktion um bis zu 50 % bis 2050 32 zu erreichen, sind neue Technologien wie genomische Selektion und Genome Editing erforderlich. Die genomische Selektion hängt von der Selektion jener SNPs ab, die günstig zum Phänotyp beitragen. Im Allgemeinen hängt der Erfolg neuer Computermethoden vom Verständnis der Besonderheiten der Pflanzenbiologie ab, die nicht mit Tieren geteilt werden, wie Selbstbefruchtung, Polyploidie und höhere genetische Variabilität 33,34,35 . Außerdem haben zweikeimblättrige und einkeimblättrige Pflanzen ihre eigenen einzigartigen genetischen Merkmale, und daher kann man das Wissen nicht großzügig von einer Pflanze auf eine andere extrapolieren, zum Beispiel aus der Modelldikotyle Arabidopsis thaliana zu Gräsern 36,37,38 .

Hier präsentieren wir eine groß angelegte Studie zur genetischen Variabilität im Reisgenom, basierend auf hochwertigen Daten aus der SNP-seek-Datenbank mit über 40 Millionen SNPs aus 3.000 Reisgenomen 25 , der bisher größten Quelle für Pflanzen-SNPs. Der Zugriff auf diese einzigartige Datenbank ermöglichte es uns, genomweite Variabilitätsmuster genau zu beschreiben und ausgeprägte Muster zu erkennen, die noch nie zuvor gesehen wurden. Wir liefern neue Beweise für einen engen Zusammenhang zwischen lokaler genetischer Variabilität und Funktionalität und schlagen vor, dass die Muster der SNP-Dichte helfen können, funktionell wichtige Genomregionen zu erkennen, die für die Verbesserung der Kulturpflanzen unerlässlich sind. So entdeckten wir spezifische charakteristische Muster in der Nähe von Stellen mit gut definierten biologischen Funktionen, wie Transkriptions- und Translationsstart- und -stoppstellen, Promotoren, Intron/Exon-Verbindungen und 5'- und 3'-UTRs. Einige Merkmale ähneln denen bei Tieren, während andere neu und einzigartig sind. Darüber hinaus haben wir die relative SNP-Dichte für verschiedene Gengruppen berechnet und gezeigt, dass Transkriptionsfaktor-kodierende Gene hoch konserviert sind, während Kinasen und membrangebundene Transporter die variabelsten Genfamilien sind.


DISKUSSION

In der vorliegenden Studie haben wir die vollständige Struktur derhNHE2 Isoform, einschließlich der Transkriptionsinitiationsstelle. Mit einer Kombination aus Screening genomischer DNA-Bibliotheken und PCR-Amplifikationstechniken haben wir die Position und Größe aller NHE2 Introns. Diese Studien haben ergeben, dass diehNHE2 Gen umfasst eine Region >81 kb des Genoms und besteht aus 12 Exons und 11 Introns. Das erste Exon enthält die 5'-UTR sowie die Transkriptions- und Translationsinitiationsstellen. Das letzte Exon enthält die letzten 122 Aminosäuren des Polypeptids, das Stopcodon und die 3'-UTR.

Ähnlich zu hNHE2, das NHE1 Isoform besteht ebenfalls aus 12 Exons und 11 Introns (33), und die Exon-Intron-Verbindungen sind zwischen den beiden Genen gut konserviert (Abb. 2). Darüber hinaus sind die beiden Gene hinsichtlich der Intron-Spleiß-Phasenbildung völlig identisch (Tabelle 2). Bei allen höheren Eukaryoten findet sich der Intron-Spleiß-Phasentyp 0, bei dem sich Introns zwischen zwei Codons befinden, häufiger als Typ 1 und 2, bei dem Introns das Leseraster unterbrechen (19). Sowohl NHE2 undNHE1, durch Insertion der Introns 1, 4 und 11 werden die kodierenden Tripletts zwischen dem ersten und zweiten Nukleotid (Typ 1) und zwischen dem zweiten und dritten Nukleotid durch die Introns 3, 7 und 8 (Typ 2) unterbrochen. Andererseits gibt es keine Unterbrechungen in den Codiertripletts durch Einfügen der Introns 2, 5, 6, 9 und 10 (Typ 0). Diese Daten zeigen, dass trotz Unterschieden in den Aminosäuresequenzen und der räumlichen Lokalisierung der NHE2- und NHE1-Proteine ​​die genomische Organisation ihrer jeweiligen Gene ziemlich ähnlich ist. nicht wiehNHE2 und hNHE1, die Ratte NHE3 undhNHE5 sind in 17 Exons und 16 Introns (24) bzw. 16 Exons und 15 Introns (2) organisiert. Diese Studien, zusammen mit der weiteren Aufklärung der Genstruktur der anderen NHE Isoformen, können für das Verständnis des Weges der molekularen Evolution der Mitglieder der NHE-Genfamilie nützlich sein.

Eine einzelne Transkriptionsinitiationsstelle wurde auf einen Adenosinrest 315 bp stromaufwärts vom ATG-Translationsstartcodon kartiert. Die 5′-flankierende Region des hNHE2 Gen fehlt eine kanonische TATA-Box (8) oder CAAT-Sequenz (13) in der erwarteten Nähe der Transkriptionsinitiationsstelle. Die Region, die sich von a Sma Die I-Restriktionsenzymstelle bei –415 zum ATG-Translationsstartcodon bei +316 besteht aus 77% G + C-Nukleotiden. Das Vorhandensein einer solchen GC-reichen Sequenz innerhalb der 5'-flankierenden Region ist ein Merkmal von TATA-losen Promotoren, die normalerweise Sp1-Bindungsstellen enthalten (40). Tatsächlich wurden zwei Sp1-Bindungsstellen in unmittelbarer Nähe der Transkriptionsstartstelle identifiziert ( 6 ), die beide mit Mitgliedern der Sp1-Transkriptionsfaktor-Familie interagieren (Malakooti und Ramaswamy, unveröffentlichte Daten). Und so kam es dass derNHE2 Genpromotor gehört zur Unterklasse der TATA-losen RNA-Polymerase II-Promotoren.

Wir haben auch mehrere andere Potenziale identifiziert cis-wirkende regulatorische Elemente in der Promotorregion. Von besonderem Interesse war die Identifizierung der CdxA- und Cdx-2-Homöodomäne-Proteinbindungsstellen. CdxA, ein Hühner-Homöobox-Gen, gehört zur kaudalen Familie der Wirbeltier-Homöobox-Gene. Die Expression dieser Gene ist während der Embryogenese auf die vom Endoderm abgeleiteten Epithelien beschränkt (15). Cdx-2 wird in den Darmepithelzellen exprimiert und es wurde berichtet (31), dass es an der Differenzierung dieser Zellen beteiligt ist. Die Bindungsstelle für Cdx-2 wurde in der 5'-regulatorischen Region von mehreren Genen identifiziert, die spezifisch in Enterozyten exprimiert werden, wie den Saccharase-Isomaltase-(46)- und Lactase-Phlorizin-Hydrolase-(49)-Genen. Weil NHE2 mRNA kommt überwiegend in Epithelzellen des Gastrointestinaltrakts vor, die Mitglieder der Cdx-Homöodomäne-Familie können an der Regulation der NHE2Genexpression während der Enterozytendifferenzierung.

Ein Vergleich von hNHE2 und Ratte NHE2 Promotorsequenzen zeigten, dass zwischen den beiden Spezies mehrere Transkriptionsfaktor-Bindungsstellen konserviert waren. Eine Kenntnis der identifizierten konservierten Elemente sowie der nicht konservierten in derhNHE2 und Ratte NHE2 Promotoren können die Grundlage für detaillierte Studien sein, die zur Identifizierung der Mechanismen führen, die die Expression des NHE2-Gens regulieren.

Transfektionsstudien zeigten eine signifikante Aktivität der NHE2 Promotor in C2BBe1-Zellen. Die Expression der Reporterkonstrukte mit unterschiedlich langen NHE2Promotorfragment legten nahe, dass ein inhibitorisches Element zwischen –1050 bis –415 bp von der Transkriptionsstartstelle vorhanden ist. Die Identifizierung eines Repressorelements in der stromaufwärts gelegenen DNA-Region entspricht dem Befund bei der Ratte NHE2 Gen (36), bei dem eine ähnliche Abnahme der Genexpression bei Deletion der stromaufwärts gelegenen Promotorsequenzen festgestellt wurde.

Die Kartierung von NHE2 bis 2q11.2 zeigte keinen Zusammenhang mit bekannten Krankheiten. Ein Defekt der NHE-Funktion wurde mit menschlichen Erkrankungen wie essentieller Hypertonie (22) und angeborener Diarrhö (5) in Verbindung gebracht. Studien von Lifton et al. (27) von Familien mit essentieller Hypertonie haben die Beteiligung von hNHE1 an dieser Krankheit ausgeschlossen. Andere NHE-Genprodukte, die an diesen Störungen beteiligt sein könnten, sind NHE2 und NHE3, von denen beide vorgeschlagen wurden, dass sie eine Hauptrolle bei der transepithelialen Na + -Absorption spielen. Kürzlich haben Schultheis et al. (42) haben in . gezeigt NHE2 Knockout-Mäusen, dass die NHE2-Isoform möglicherweise für die langfristige Lebensfähigkeit der Belegzellen und nicht für ihre Säuresekretion erforderlich ist. Bisher wurde jedoch keine menschliche Krankheit eindeutig auf eine der NHEIsoformen.

Zusammenfassend lässt sich sagen, dass die genomische Struktur und die Promotorregion deshNHE2 Gen wurden charakterisiert und dem Chromosom 2q11.2 zugeordnet. Die Kenntnis der genomischen Organisation, der chromosomalen Loci und der Promotorregion aller NHE-Isoformen wird die Suche nach Mutationen in diesen Genen und die Identifizierung ihrer Rolle bei menschlichen Krankheiten, einschließlich essentieller Hypertonie, angeborener Diarrhö und anderen Erkrankungen des Magen-Darm-Trakts, erleichtern .

Wir danken V. C. Memark für technische Hilfe.