Das Institut fuer Theoretische Chemie befindet sich in der Waehringerstr.17 und ist eine rein theoretische Forschungseinrichtung.
Ziel unserer Arbeit ist die naehere charakterisierung verschiedener experimentell gefundener RNAs.
Es gibt verschiedene RNAs, von denen die mRNA, rRNA, und tRNA wohl am bekanntestens sind. Diese dienen der Proteinbiosynthese.
snRNA, snoRNA, yRNA, SRP RNA, miRNA, siRNA, piRNA, und 7SK RNA sind weitere, bereits bekannte, RNAs im Menschen.
Wir erhalten unsere Daten aus einem GEN-AU Labor in Innsbruck, wo durch 454-Sequencing an Proteine gebundene RNAs sequenziert werden.Diese Daten
werden hier im Institut untersucht. Zunaechst werden bekannte RNAs identifiziert, um diese aus der weiteren Forschungsarbeit ausschliessen zu koennen. Der Grossteil der in Innsbruck gefundenen RNA Sequenzen
korrespondiert mit bereits bekannten ncRNAs (ncRNA: nicht
protein-codierende RNA). Wir betrachten hier, nachdem die bekannten RNAs aussortiert wurden, hauptsaechlich die haeufiger vorkommenden noch unbekannten RNAs.
Das Institut hat ein weitlaeufiges Netzwerk aus Linux-Computern. Fuer groessere Rechenleistung stehen uns auch 8-Kern-Rechencluster mit 32 GB RAM zur Verfuegung. Wir arbeiten hauptsaechlich ueber das Linux-Terminal und
nutzen serverbasierende Programme, bzw. laden diverse Programme zur RNA-Forschung aus dem Internet herunter.
Ich war bei meinem Praktikum im Rahmen der GenAu-SummerSchool an der UMIT im Bereich der biomedizinischen Informatik tätig. Unsere Forschungsgruppe entwickelte dort ein Wiki für biomedizinische Informatik.
Ich möchte von dir wissen. was das für Programme sind, die ihr aus dem Internet heruntergeladen habt.
Tag 1
Zunaechst haben wir durch sogenanntes "blasten" verschiedene RNAs miteinander
verglichen und so bereits bekannte aussortiert.
BLAST (Basic Local Alignment Search Tool) stellt fest ob kleine
(eingegebene) Sequenzen in anderen vorkommen. Dazu durchsucht es Sequenzen,
die zusammen mehrere Milliarden Nukleotide lang sind
Tag 2
Um ein Clustering aufzustellen, versuchten wir RNAclust zu installieren,
was uns jedoch erst nach der Installation zweier weiterer Programme und einer
Korrektur im C++Code gelang.
Tag 3
Die Eingabe unserer Daten in das RNAclust-Programm fuehrte jedoch zu keinem
Ergebnis, da das Programm offenbar fehlerhaft war.
Tag 4
Heute haben wir fuer die ganze Gesellschaft Spaghetti mit einem
Tomaten-Schafskaese-Sugo gekocht.
Arbeitsmaessig haben wir uns mit MEME (=Multiple Em for Motif Elicitation) beschaeftigt. Dieses Programm sucht
nach bestimmten Mustern die sich innerhalb der Sequenz und auch in anderen
Proben wiederholen.
Tag 5
RNAclust hat heute aus bisher ungeklaerten Gruenden funktioniert und wir
erhielten unseren Clustering-Baum. Dieser wies allerdings keine sehr brauchbare
bzw.interessante Information auf, da die verwendeten RNAs nicht sehr viele
Gemeinsamkeiten haben und nur sehr sehr weitschichtig miteinander verwandt
sind.
~~~Mittagspause~~~
Tag 6 Montag
Wir erstellten den Baum noch einmal, mit den selben Daten, allerdings mit
lokaler Strukturinformation (der erste Baum wurde nur mit lokaler
Sequeninformatione erstellt), wodurch wir naehere
Verwandtschaftsverhaeltnisse erhielten und dieser zweite Baum somit
interessanter fuer uns war.
Per E-Mail wurden uns PSE-Files (Proximales Sequenzelement) zugeschickt,
aus denen wir eine PSWM (Position Specific Weight MAtrix) erstellen sollen.
Weiters erstellten wir MAf-Files fuer die Reads aus Mouse und Human.Diese
Daten verwendeten wir als Input im RNAz.
Tag 7
Heute standen Tutorials am Programm. Wir erhielten den Auftrag uns diese
sorgfaeltig durchzulesen und angegebene Beispiele auszuprobieren.Folgende
Programme haben wir uns angesehen:
# Structure Prediction on single Sequences
* The Program RNAfold
* The Program RNASubopt
# RNA folding kinetics
# Sequence Design
* The Program RNAinverse
# RNA-RNA Interactions
* The Program RNAcofold
* Concentration Dependency
* Finding potential binding sites with RNAduplex
# Consensus Structure Prediction
* The Program RNAalifold
o Structure predictions for the individual sequences
Tag 8
Vor lauter Arbeit kamen wir leider nicht zum dokumentieren und weil wir seither soviele verschiedene Arbeiten im Kopf hatten wissen wir jetzt leider nicht mehr, was genau wir an Tag 8 zu tun hatten, es war jedenfalls sehr spannend!;)
Tag 9
Wir nutzten BED -files (enthalten die genomischen Koordinaten unserer
Kandidaten) von Human und Mouse um nach Repeats im
Genomebrowser zu suchen. Die Art der Repeats (z.B. Transposons,LTR Long
Terminal Repeats, LINE/SINE Long/Short Interspersed Nuclear Elements, usw)
wurde festgehalten.
Tag 10
RNAz-Alignments wurden mit den BED-Files verglichen und eingetragen
Tag11
Wir haben das Programm RNAmicro installiert um in unseren Alignments nach
MIcro RNAs suchen zu koennen. Abermals lief das PRogramm nicht auf
Anhieb. Anschliessend haben wir ein Paper bezueglich der Funktionsweisen
des Programmes gelesen.
Es stellte sich allerdings heraus, dass einige Alignments zu lang waren.
Tag12
Die langen Alignments wurden auf 200 Nukleotide gekuerzt und untersucht.
Institute of theoretical chemistry
Ziel unserer Arbeit ist die naehere charakterisierung verschiedener experimentell gefundener RNAs.
Es gibt verschiedene RNAs, von denen die mRNA, rRNA, und tRNA wohl am bekanntestens sind. Diese dienen der Proteinbiosynthese.
snRNA, snoRNA, yRNA, SRP RNA, miRNA, siRNA, piRNA, und 7SK RNA sind weitere, bereits bekannte, RNAs im Menschen.
Wir erhalten unsere Daten aus einem GEN-AU Labor in Innsbruck, wo durch 454-Sequencing an Proteine gebundene RNAs sequenziert werden.Diese Daten
werden hier im Institut untersucht. Zunaechst werden bekannte RNAs identifiziert, um diese aus der weiteren Forschungsarbeit ausschliessen zu koennen. Der Grossteil der in Innsbruck gefundenen RNA Sequenzen
korrespondiert mit bereits bekannten ncRNAs (ncRNA: nicht
protein-codierende RNA). Wir betrachten hier, nachdem die bekannten RNAs aussortiert wurden, hauptsaechlich die haeufiger vorkommenden noch unbekannten RNAs.