Oxidation von Methylgruppen durch Tet und andere Dioxygenasen

Im Dokument Synthese und Analyse von natürlichen DNA-Modifikationen zur Aufklärung des epigenetischen DNA-Metabolismus (Seite 33-38)

1.4 DNA-Hydroxymethylierung

1.4.1 Oxidation von Methylgruppen durch Tet und andere Dioxygenasen

Dioxygenasen. Diese bewerkstelligen u.a. die thermodynamisch gesehen herausfordernde CH-Aktivierung und Oxidation von Methylgruppen durch bimolekularen Sauerstoff.[108-112] Bevor gezeigt wurde, dass Tet die Methylgruppe von 5mdC hydroxyliert (Schema 6),[5] kannte man bereits zwei ähnliche Mechanismen, bei denen die Dioxygenasen Jbp1/2 (J- bindendes Protein) und T7h (Thymin-7-Hydroxylase) die Methylgruppe von Thymin oxidieren (Schema 7):

Schema 7 | Oxidation von Methylgruppen durch Dioxygenasen. (A) Der Parasit Trypanosoma brucei modifiziert sein Genom durch postreplikative Hydroxylierung der Methylgruppe von dT durch

die Dioxygenasen Jbp1/2 und anschließender Glykosylierung der Hydroxy-Gruppe durch eine β- Glykosyltransferase. Dabei entsteht die sogenannte Nukleobase J (5-(β-D-Glukopyranosyl-oxymethyl)- 2′-desoxyuridin). (B) Demethylierung von Thymin zu Uracil in Neurospora crassa mittels sukzessiver Oxidation durch die Thymin-7-hydroxylase (T7h) und anschließender Decarboxylierung durch die Isoorotatdecarboxylase (Idc).

Das Genom von Kinetoplasten, wie das des Parasiten Trypanosoma brucei, welches die afrikanische Schlafkrankheit auslöst, enthält die sogenannte Nukleobase J. Diese wird in einem zweistufigen Prozess postreplikativ durch Hydroxylierung der Methylgruppe von dT durch Jbp1 und Jbp2, sowie anschließender Glykosylierung der Hydroxy-Gruppe durch eine β-Glycosyltransferase gebildet (Schema 7A).[113-117] Bioinformatische Analysen von Jpb1/2

führten schließlich zur Vorhersage,[118] dass Tet-Proteine eine 5mdC-oxidierende Aktivität

haben könnten und trieben diese Entdeckung voran.[5, 119] Neben Jbp und Tet gehören auch die entfernt verwandten AlkB-Reparaturenzyme, welche aberrante Methylgruppen geschädigter

13

Nukleobasen entfernen,[120-122] als DNA-bindende Proteine zur Superfamilie der Fe(II)- und

OG-abhängigen Dioxygenasen.[108-112]

Desweiteren können manche Pilze, wie Neurospora crassa, Thymin demethylieren, um Uracil zurückzugewinnen. Hierzu katalysiert T7h die iterative Oxidation zu 5-Hydroxymethyl-, 5-Formyl- und 5-Carboxyuracil (5hmU, 5fU und 5caU);[109] ein sich anschließender Decarboxylierungsschritt wird durch die Isoorotatdecarboxylase (Idc) verwirklicht (Schema

7B).[123-125] Dieser Mechanismus inspirierte die Forschungsarbeit dieser Dissertation und anderer Arbeiten[3, 76, 110] bei der Untersuchung der aktiven DNA-Demethylierung (siehe Kapitel 1.6, 3 und 4).

Tet-Proteine: Vorkommen, Struktur, Substrat- und DNA-Erkennung

Bevor man die Funktion der Tet-Enzyme entdeckte, kannte man das humane Tet1-Protein bereits als aberranter Fusionspartner der H3K4-Methyltransferase MLL (Mixed Lineage

Leukemia) in Leukämie-Patienten. Das entsprechende Tet1-Gen translozierte bei diesen

Patienten von Chromosom 10 zu Chromosom 11 (Ten Eleven Translocation). Dieser Sachverhalt wurde daher namensgebend für das Protein.[126-127] Durch bioinformatische Methoden identifizierte man im Menschen zwei weitere paraloge Gene, Tet2 und Tet3,[127] und orthologe Gene im gesamten Reich vielzelliger Tiere, deren genomische DNA 5mdC enthält.[5, 119]

Alle drei Tet-Proteine haben eine C-terminale katalytische Domäne, die sich aus einer Cystein-reichen Region und einer doppelsträngigen β-Helix-Region (DSBH) zusammensetzt (Abbildung 4).[5, 119] Die Kristallstrukturanalyse der katalytischen Domäne von humanem

Tet2 im Komplex mit 5mdC-enthaltender DNA zeigte, dass die Cystein-reiche Region keine separate strukturelle Einheit ist, sondern sich in eine N- und C-terminale Subdomäne unterteilt, die sich um den DSBH-Kern winden.[128] Hierbei unterstützen drei Zn(II)-Zentren (Zinkfinger) den Zusammenhalt der katalytischen Domäne und damit die Stabilisierung der gebogenen DNA-Struktur. Dies schafft die Grundlage für das Herausdrehen von 5mdC aus dem DNA-Duplex durch einen flipping-Mechanismus und die Positionierung der Methylgruppe in direkter Nähe zum katalytischen Fe(II)-Zentrum in der DSBH-Region (Abbildung 5).[128-129]

14

Abbildung 4 | Schematische Darstellung der Domänen innerhalb der Primärstruktur von murinen Tet-Proteinen. Alle drei haben eine C-terminale katalytische Domäne (KD), die sich aus

einer Cys-reichen Region und einer doppelsträngigen β-Helix-Region (DSBH) zusammensetzt. Innerhalb der DSBH-Sequenz befindet ein wenig konserviertes Insert (gelb), dessen Länge unter den Tet-Proteinen variiert und die katalytische Aktivität kaum beeinflusst.[119, 128-130] Die N-Termini enthalten

eine CXXC-Domäne, außer Tet2, welches mit Idax (CXXC4) assoziiert. Tet3 hat zudem eine PRK12323 Domäne (DNA-Polymerase III Untereinheit), deren Funktion noch ungeklärt ist. As = Aminosäuren. Die Abbildung wurde von Tan und Shi adaptiert.[131]

Die DSBH-Regionen fast aller Dioxygenasen enthalten mit der Sequenz His-X-Asp/Glu-XN-

His ein hochkonserviertes dreizähniges Fe(II)-Bindungsmotiv, das eine Fläche des oktaedrischen Fe-Zentrums bildet (Abbildung 5). Zusätzlich enthält die DSBH-Region ein konserviertes Arginin, das OG zusammen mit zwei Fe(II)-Koordinationsstellen bindet.[108-109,

111-112, 128, 132-135] Die Bindung bzw. Erkennung von 5mC erfolgt über zwei Wasserstoff-

brückenbindungen zwischen der N3- und N4-Position der Nukleobase und den Seitenketten von Histidin und Asparagin (Abbildung 5). Interessanterweise indizieren Sequenzvergleiche, dass in Jbp-Proteinen anstelle dieser Aminosäurereste Aspartat und Arginin für die molekulare Erkennung von Thymin verantwortlich sein könnten. Die Bindung der zu oxidierenden Nukleobase wird daneben noch zusätzlich durch Stacking-Effekte mit einem konservierten Tyrosin-Rest unterstützt.

Tet-Proteine haben darüber hinaus eine Substratpräferenz für 5mCpG-Dinukleotide.[128-129] In der Tet2-Kristallstruktur wurden außer zu dem CpG-Dinukleotid keine weiteren Kontakte zu flankierenden Nukleobasen beobachtet, sondern nur Wasserstoffbrückenbindungen zu einigen Phosphaten (Abbildung 5). Hierdurch kann strukturell gesehen eine höhere Sequenzspezifität ausgeschlossen werden. Die molekulare Erkennung von CpG-Dinukleotiden ist scheinbar für die Positionierung der Methylgruppe am Reaktionsort essenziell, sodass 5mCpH-Dinukleotide (H= A, T, C) mit geringeren Reaktionsraten oxidiert werden.[128] Die Methylgruppe von 5mC

15

geht im aktiven Zentrum keine Proteinkontakte ein, so dass die umgebende Proteintasche genügend Platz für das Oxidationsprodukt bietet.[128]

Abbildung 5 | Kristallstrukturausschnitt von humanem Tet2 im Komplex mit 5mdC-enthaltender DNA. Dargestellt sind der zu oxidierende DNA-Strang und alle Aminosäurereste die an dessen

direkter Protein-Wechselwirkung beteiligt sind, sowie die Aminosäurereste der Fe(II)-Koordination. Die Wassermoleküle bzw. das Fe(II)-Atom sind mit roten bzw. orangen Sphären, das OG-Analogon N- Oxalylglycin (NOG) in cyan dargestellt.[128]

Zusätzlich zur C-terminalen katalytischen Domäne besitzen Tet-Enzyme zwei weitere Domänen, über die wahrscheinlich die genomische Lokalisation und die enzymatische Aktivität reguliert wird. Zum einen besitzen alle Tet-Enzyme eine variable weniger konservierte Einfügung (Insert) innerhalb der Primärstruktur der C-terminalen DSBH- Domäne (Abbildung 4). Das Insert ist je nach Tet-Protein unterschiedlich lang[119, 130-131] und steht in der Tertiärstruktur von der katalytischen Domäne weg.[128-129] In Tet1 weist das Insert zudem eine hohe Ähnlichkeit zur C-terminalen Domäne (CTD) der RNA-Polymerase II (S.

cerevisiae) auf.[136] Darüber hinaus besitzen Tet1 und Tet3 je eine N-terminale CXXC- Domäne (~60 Aminosäuren), die vielen Chromatin-assoziierten Proteinen als gängiges DNA- Bindungsmotiv gemeinsam ist.[119, 127] Das Tet2-Gen durchlief evolutionär eine chromosomale Inversion, bei der der CXXC-Domänenabschnitt abgetrennt wurde und sich zu einem eigenständigen Gen namens Idax (oder CXXC4) entwickelte.[119, 130] Eine CXXC-Domäne koordiniert ein Zn(II)-Ion und enthält zwei Kopien des konservierten Motivs CGXCXXC(X)NC, wobei X jede beliebige Aminosäure repräsentiert.[134] CXXC-Domänen

von Chromatin-assoziierten Proteinen binden typischerweise bevorzugt an unmethylierte CpG-Stellen.[137-139] Dementsprechend zeigten Genom-weite Lokalisationsstudien, dass die Tet-Enzyme hauptsächlich an unmethylierten DNA-Bereichen zu finden sind. Biochemische

16

Studien indizierten aber auch, dass die CXXC-Domänen der Tet-Enzyme untypischerweise über eine erhöhte Flexibilität in ihrer Sequenzselektivität verfügen.[140-142] So bindet Tet1-

CXXC möglicherweise neben unmethylierten auch methylierte CpGs,[143-144] und Tet3-CXXC

bindet sowohl an unmethylierte CpGs und CpHs (H = A, C, T).[145]

Katalytischer Mechanismus von Fe(II)- und OG-abhängigen Dioxygenasen

Der postulierte Mechanismus von Tet beruht auf dem Konsensmechanismus Fe(II)- und OG- abhängiger Dioxygenasen und ist in Schema 8 dargestellt.[108-109, 111-112, 128, 132-135] Es ist davon auszugehen, dass die katalysierte Reaktion nach einem Ping-Pong-Mechanismus[146] verläuft, d.h. das Enzym wird zuerst durch ein Cosubstrat chemisch verändert, bevor im Anschluss das eigentliche Substrat umgesetzt wird.[146] In diesem Sinne erfolgt in einem ersten Schritt die Oxidation von Fe(II) zu Fe(IV) durch das Cosubstrat OG und bimolekularem Sauerstoff. In sequenziell geordneter Weise findet an Fe(II) zunächst ein Ligandenaustausch von zwei H2O-

Molekülen durch OG statt. Anschließend oder gleichzeitig bindet das primäre Substrat.[147-149] Hierdurch wird die Bindung des axialen H2O-Moleküls geschwächt und die Bindung von O2

begünstigt, bei der Fe(II) zu Fe(III) oxidiert.[112, 132, 150-151]

In einem irreversiblen Schritt erfolgt jetzt die oxidative Decarboxylierung von OG zu Succinat und die Oxidation von Fe(III), wodurch bimolekularer Sauerstoff homolytisch gespalten wird und sich das Fe(IV)-Oxo-Intermediat ausbildet (Schema 8).[108-109, 111-112, 128, 132-

135, 152] Dieser irreversible Schritt ist bei den entfernt verwandten Dioxygenasen T7h oder der

Prolyl-4-Hydroxylase ratenbestimmend, wie es durch Analyse von kinetischen Isotopen- effekten demonstriert wurde: Bei Verwendung von deuterierten oder tritiierten Thymin- bzw. Prolin-Derivaten wurde kein oder ein vergleichsweise geringer Isotopeneffekt während der Gesamtreaktion beobachtet.[133, 135, 147, 149] Das reaktive Fe(IV)-Oxo-Intermediat oxidiert dann das primäre Substrat durch C–H-Abstraktion, wobei ein Substrat-Radikal als Intermediat entsteht, das mit dem gleichzeitig entstandenen Fe(III)-OH-Komplex mit einer Übertragung eines Hydroxy-Radikals erneut reagiert. Die Dissoziation der Produkte Succinat und 5hmdC komplettiert abschließend den katalytischen Zyklus.

17

Schema 8 | Postulierter Reaktionsmechanismus der Fe(II)- und 2-Oxoglutarat (OG) abhängigen Dioxygenasen Tet und Jbp. Für alle gezeigten Intermediate gibt es bei verschiedenen Dioxygenasen

Beweise, mit Ausnahme der O2-Komplexe und des Fe(III)-OH-Intermediats.[108-109, 111-112, 128, 132-135] R-H:

5mdC oder dT als Substrate (R' = NH2 bzw. OH; R'' = DNA). Nota bene: dT und seine Derivate (R' =

OH) liegen ausschließlich als (C=O)-N(H)-(C=O)-Tautomer vor. Aus Gründen der Übersichtlichkeit wurde auf diese Darstellung verzichtet.

Im Dokument Synthese und Analyse von natürlichen DNA-Modifikationen zur Aufklärung des epigenetischen DNA-Metabolismus (Seite 33-38)