Das Institut fuer Theoretische Chemie befindet sich in der Waehringerstr.17 und ist eine rein theoretische Forschungseinrichtung.
Ziel unserer Arbeit ist die naehere charakterisierung verschiedener experimentell gefundener RNAs.
Es gibt verschiedene RNAs, von denen die mRNA, rRNA, und tRNA wohl am bekanntestens sind. Diese dienen der Proteinbiosynthese.
snRNA, snoRNA, yRNA, SRP RNA, miRNA, siRNA, piRNA, und 7SK RNA sind weitere, bereits bekannte, RNAs im Menschen.
Wir erhalten unsere Daten aus einem GEN-AU Labor in Innsbruck, wo durch 454-Sequencing an Proteine gebundene RNAs sequenziert werden. Diese Daten
werden hier im Institut untersucht. Zunaechst werden bekannte RNAs identifiziert, um diese aus der weiteren Forschungsarbeit ausschliessen zu koennen. Der Grossteil der in Innsbruck gefundenen RNA Sequenzen
korrespondiert mit bereits bekannten ncRNAs (ncRNA: nicht
protein-codierende RNA). Wir betrachten hier, nachdem die bekannten RNAs aussortiert wurden, hauptsaechlich die haeufiger vorkommenden noch unbekannten RNAs.
Tag 1
Zunaechst haben wir durch sogenanntes "blasten" verschiedene RNAs miteinander
verglichen und so bereits bekannte aussortiert.
BLAST (Basic Local Alignment Search Tool) stellt fest ob kleine
(eingegebene) Sequenzen in anderen vorkommen. Dazu durchsucht es Sequenzen,
die zusammen mehrere Milliarden Nukleotide lang sind
Tag 2
Um ein Clustering aufzustellen, versuchten wir RNAclust zu installieren,
was uns jedoch erst nach der Installation zweier weiterer Programme und einer
Korrektur im C++Code gelang.
Tag 3
Die Eingabe unserer Daten in das RNAclust-Programm fuehrte jedoch zu keinem
Ergebnis, da das Programm offenbar fehlerhaft war.
Tag 4
Heute haben wir fuer die ganze Gesellschaft Spaghetti mit einem
Tomaten-Schafskaese-Sugo gekocht. Wir wuerzten es mit Oregano und
verfeinerten den Geschmack mit einem Schuss Rotwein.
Arbeitsmaessig haben wir uns mit MEME (=Multiple Em for Motif Elicitation) beschaeftigt. Dieses Programm sucht
nach bestimmten Mustern die sich innerhalb der Sequenz und auch in anderen
Proben wiederholen.
Tag 5
RNAclust hat heute aus bisher ungeklaerten Gruenden funktioniert und wir
erhielten unseren Clustering-Baum. Dieser wies allerdings keine sehr brauchbare
bzw.interessante Information auf, da die verwendeten RNAs nicht sehr viele
Gemeinsamkeiten haben und nur sehr sehr weitschichtig miteinander verwandt
sind.
~~~Mittagspause~~~
Wir erstellten den Baum noch einmal, mit den selben Daten, allerdings mit
lokaler Strukturinformation (der erste Baum wurde nur mit lokaler
Sequeninformatione erstellt), wodurch wir naehere
Verwandtschaftsverhaeltnisse erhielten und dieser zweite Baum somit
interessanter fuer uns war.
Per E-Mail wurden uns PSE-Files (Proximales Sequenzelement) zugeschickt,
aus denen wir eine PSWM (Position Specific Weight MAtrix) erstellen sollen.
Weiters erstellten wir MAf-Files fuer die Reads aus Mouse und Human.Diese
Daten verwendeten wir als Input im RNAz.
Tag 7
Heute standen Tutorials am Programm. Wir erhielten den Auftrag uns diese
sorgfaeltig durchzulesen und angegebene Beispiele auszuprobieren.Folgende
Programme haben wir uns angesehen:
# Structure Prediction on single Sequences
* The Program RNAfold
* The Program RNASubopt
# RNA folding kinetics
# Sequence Design
* The Program RNAinverse
# RNA-RNA Interactions
* The Program RNAcofold
* Concentration Dependency
* Finding potential binding sites with RNAduplex
# Consensus Structure Prediction
* The Program RNAalifold
o Structure predictions for the individual sequences
Wir nutzten BED -files (enthalten die genomischen Koordinaten unserer
Kandidaten) von Human und Mouse um nach Repeats im
Genomebrowser zu suchen. Die Art der Repeats (z.B. Transposons,LTR Long
Terminal Repeats, LINE/SINE Long/Short Interspersed Nuclear Elements, usw)
wurde festgehalten.
Tag 10 Freitag
RNAz-Alignments wurden mit den BED-Files verglichen und eingetragen
Tag11 Montag
Wir haben das Programm RNAmicro installiert um in unseren Alignments nach
MIcro RNAs suchen zu koennen. Abermals lief das PRogramm nicht auf
Anhieb. Anschliessend haben wir ein Paper bezueglich der Funktionsweisen
des Programmes gelesen.
Es stellte sich allerdings heraus, dass einige Alignments zu lang waren.
Tag12 Dienstag
Die langen Alignments wurden auf 200 Nukleotide gekuerzt und untersucht.
Theoretical Biochemistry Group
Ziel unserer Arbeit ist die naehere charakterisierung verschiedener experimentell gefundener RNAs.
Es gibt verschiedene RNAs, von denen die mRNA, rRNA, und tRNA wohl am bekanntestens sind. Diese dienen der Proteinbiosynthese.
snRNA, snoRNA, yRNA, SRP RNA, miRNA, siRNA, piRNA, und 7SK RNA sind weitere, bereits bekannte, RNAs im Menschen.
Wir erhalten unsere Daten aus einem GEN-AU Labor in Innsbruck, wo durch 454-Sequencing an Proteine gebundene RNAs sequenziert werden. Diese Daten
werden hier im Institut untersucht. Zunaechst werden bekannte RNAs identifiziert, um diese aus der weiteren Forschungsarbeit ausschliessen zu koennen. Der Grossteil der in Innsbruck gefundenen RNA Sequenzen
korrespondiert mit bereits bekannten ncRNAs (ncRNA: nicht
protein-codierende RNA). Wir betrachten hier, nachdem die bekannten RNAs aussortiert wurden, hauptsaechlich die haeufiger vorkommenden noch unbekannten RNAs.
Theoretical Biochemistry Group