Tag 2:
Nach einem sehr anstrengenden, dafür aber durchaus informativen ersten Arbeitstag, geht es heute mit weiteren Informationen über den genauen Aufbau (speziell Sekundärstruktur) und die verschiedenen Formen von snoRNAs weiter. Generell unterscheidet man die Box C/D snoRNA von der Box H/ACA snoRNA. Die Box C/D snoRNA besitzt zwei verschiedene, kurze, konservierte Sequenz-Motive, die C Box(UGAUGA) und D Box(CUGA) in der Nähe 5' und 3' Enden. Die Regionen unterhalb der C Box und oberhalb der D Box sind normalerweise basen-komplimentär, also zwei gepaarte Stränge, wodurch im Gesamten eine sogenannte "stem-box" Struktur ensteht. (Foto 2)
Außerdem haben manche Box C/D snoRNAs auch eine nicht exakte Kopie von den beiden Boxen, welche man C' Box und D' Box nennt. (Ich könnte noch genauer über die Methyl-Gruppen der Box C/D snoRNAs schreiben, aber das wäre viel zu lang und wird wahrscheinlich, wenn überhaupt, nur in meine Projektarbeit nach meinem Praktikum einfließen.)Die Box H/ACA snoRNAs besiten nicht nur zwei dieser "stems" und dadurch auch zwei "loop"-Regionen, was das ganze wie zwei große Schlaufen aussehen lässt, sondern zwei andere wichtige, konservierte Stellen: Box H(ANANNA) und Box ACA(ACA), wie es der Name dieser Art von snoRNAs schon sagt.
Jetzt weiß ich wirklich sehr sehr viel über snoRNAs und kann es kaum erwarten, damit zu arbeiten! Allerdings muss ich vorher noch einige Alignments von gefundenen sogenannten "perverse snoRNAs", also eigenartigen snoRNAs, von einigen Lebewesen, wie dem Menschen(h.sapiens) oder dem Frosch(xenopus laevis), sortieren.
Als nächstes erklärte mir mein Betreuer die Funktion eines Programmes, das auch von diesem Institut entwickelt wurde. Es ist noch etwas ungenau, daran wird allerdings noch gearbeitet. Vereinfacht kann man sagen, dass dieses Programm snoRNAs aufsucht, indem es bestimmte bereiche einer RNA scannt. Ich arbeite zum Beispiel an C.Elegans, eine bestimmte Wurm-Art, und durchsuche die Chromosome I,II,III,IV,V und X. Zuerst wird auf der RNA eine Region aufgesucht, in der sich die Promotoren, die für die Polymerase notwendig sind, befinden, um dann in den darauf anschließenden 200nt (nt=Nukleotide) nach mehreren (mindestens 4) "Ts" suchen zu können. Denn normalerweise ist es so, dass snoRNAs um die 60-150nt lang ist und falls eine snoRNA vorhanden ist, befindet sie sich zwischen den Promotoren der RNA und den aufeinanderfolgenden Ts. Das Programm findet nurn pro Chromosom mehrere Treffer ("Hits") und gibt an, wo sich diese Treffer befinden. (foto3)
Dies sieht ca. so aus:
Genome file: /scr/linguini/agruber/genomes/Caenorhabditis_elegans/chrI.fa
We have found 435 promoter hits with a cutoff > -34.
15 hits left after filtering for polyT.
14 hits left after removing sequences that are likely to be repeats.
Hit: 1
Total promoter score: -28.57 A: -24.90 B: -3.21
snoReport: CD, 0.998570
ACAseeker: none
CDseeker: none
TGGTTCGATCCCCACCAAGCGATGACGATTGATATCTGCTCTAATGAGTCTGAATTACCATGTTGAGATCTTGTCTGAGCTCCTTTTTggcttttacacggtgaaaag
MFE: .((......)).((((((((((((.(....).)))).((((..(..(((((.(((......))).))).))..)..)))).........))))......)))).....
CNT: ............((((.....................((((..(..(((((.(((......))).))).))..)..))))...................)))).....
Hit: 2
Total promoter score: -25.58 A: -10.96 B: -14.16
snoReport: HACA, 0.996150
ACAseeker: HIT
CDseeker: none
CAGCTCGACCCTGACACACGGCCAGTTTGAGTTGATTCGCTCTTTCGCAATAGAGCTTTGAGTCAAATTACTGTCCGGAAATTATAGAGATGAAGCTCATTTGGAGCAATAACAATTGTTGAAGCTCCGAAAATGATGCTCTTCCCACAATTTTCTCTAGTTTTTTTTgtttttttaaaagagatata
MFE: (((.......))).....(((.((((.....((((((((((((........)))))...)))))))...)))).))).......((((((.((((((((((((((((..((((....))))..)))))))..)))).)))..........)).))))))((((((((((......))))))))))...
CNT: ..................(((.((((.....((((((((((((........)))))...)))))))...)))).))).......((((((...((((((((((((((..((((....))))..)))))))..)))).))).............)))))).............................
...und so weiter.
Die Klammern sollen die Sekundärstruktur darstellen, daran kann man, wenn man sich bereits in diesem Gebiet auskennt, erkennen, ob es eine snoRNA sein könnte. Dann betrachtet man die Abfolge der AS (Aminosäuren) und hält nach TTTT.. und zB. ACA ausschau. Befindet sich nun etwas in der Art in der durchsuchten Region, kann man sich nun ein weiteres Programm im Internet zur Hilfe nehmen:
http://genome.ucsc.edu/
Diese Seite beinhaltet sämtliche Genome von verschiedensten Lebewesen und man kann, wenn man die Nukleotidsequenz (bei hit1 wäre das zB: TGGTTCGATCCCCACCAAGCGATGACGATTGATATCTGCTCTAATGAGTCTGAATTACCATGTTGAGATCTTGTCTGAGCTCCTTTTTggcttttacacggtgaaaag) auf dieser Seite bei dem Button "Blat" eingibt, die konservierten Regionen betrachten und auch sehen, ob eine snoRNA vorhanden ist,um welche snoRNA es geht, wenn eine vorhanden ist, bei welchen Organismen sie auch gefunden wurde usw.
Damit arbeite ich heute (bereits Tag 3) auch noch weiter und durchsuche sämtliche Nukleotidsequenzen der verschiedenen Chromosome von C. Elegans. Vielleict entdecke ich ja sogar eine noch unbekannte snoRNA. :)