Λειτουργικός γονιδιωματικός σχολιασμός σε ευκαρυωτικούς οργανισμούς

Το τεκμήριο παρέχεται από τον φορέα :
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών   

Αποθετήριο :
Πέργαμος   

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*



Λειτουργικός γονιδιωματικός σχολιασμός σε ευκαρυωτικούς οργανισμούς

Καπώνης Αλέξιος (EL)
Kaponis Alexios (EN)

born_digital_postgraduate_thesis
Διπλωματική Εργασία (EL)
Postgraduate Thesis (EN)

2024


Ο αυτόματος χαρακτηρισμός των γονιδίων σε ένα νέο γονιδίωμα συνίσταται στην εύρεση των ορίων των γονιδίων, των εξονίων τους, των κωδικοποιουσών αλληλουχιών καθώς και την ανακάλυψη των ορθολόγων τους σε άλλους οργανισμούς-πρότυπα. Στόχος της εργασίας είναι η σύγκριση των υπαρχόντων εργαλείων λειτουργικού γονιδιωματικού σχολιασμού με απώτερο στόχο την εύρεση της βέλτιστης ροής εργασίας που θα συνδυάσει ένα γονιδίωμα σπονδυλοζώου με πρωτεϊνικές και νουκλεοτιδικές αλληλουχίες, καθώς και δεδομένα μεταγραφωμικής και θα ενσωματώσει τα αποτελέσματα προγραμμάτων εξ υπαρχής (ab initio) εύρεσης γονιδίων, για να ανακαλύψει τα όρια των γονιδίων και θα χαρακτηρίσει λειτουργικά τα γονίδια. Αρχικά θα γίνει λήψη ενός γονιδιώματος-στόχου από την βάση δεδομένων γονιδιωματικών αλληλουχιών του NCBI Genome. H πειραματική πορεία που θα ακολουθηθεί θα είναι παρόμοια με αυτή του γονιδιωματικού σχολιασμού του σκόρδου (Allium sativum) (Sun et al., 2020). Τα γονίδια που κωδικοποιούν πρωτεΐνες θα σχολιαστούν συνδυάζοντας προγράμματα σε διάφορα επίπεδα. Σε πρώτο επίπεδο θα χρησιμοποιηθούν προγράμματα εξ υπαρχής εύρεσης γονιδίων, όπως το GlimmerHMM (Majoros, Pertea, & Salzberg, 2004) και προγράμματα ομολογίας αλληλουχιών που προέρχονται από κοντινούς συγγενείς του είδους. Επόμενο βήμα είναι η εκμετάλλευση των διαθέσιμων δεδομένων RNA-seq του οργανισμού και η χαρτογράφησή τους έναντι του γονιδιώματος-στόχου, με την χρήση προγραμμάτων όπως το EVM (Haas et al., 2008). Τελευταίο βήμα είναι ο συγκερασμός των παραπάνω αποτελεσμάτων προκειμένου να γίνει ο σχολιασμός των γονιδίων με όσο το δυνατόν μεγαλύτερη ακρίβεια, παράγοντας ένα αρχείο τύπου GFF3 (Generic Model Organism Database, 2021). (EL)
The automatic annotation of genes in a new genome involves finding the boundaries of the genes, their exons, their coding sequences, as well as the discovery of their orthologs in other model organisms. The aim of this work is to compare existing functional genome annotation tools with the ultimate goal of finding the best workflow that will combine a vertebrate genome with protein and nucleotide sequences, as well as transcriptional data and will incorporate the results of ab initio gene finding programs to discover gene boundaries and functionally characterize the genes. Initially, a target genome will be obtained from the NCBI Genome gene sequence database. The experimental pathway to be followed will be similar to that of the genome annotation of garlic (Allium sativum). Protein-coding genes will be annotated by combining programs at various levels. At the first level, programs for ab initio gene finding, such as GlimmerHMM and sequence homology programs derived from close relatives of the species will be used. The next step is to leverage the available RNA-seq data of the organism and map them against the target genome using programs such as EVM. The final step is the integration of the above results in order to annotate the genes with the highest possible accuracy, generating a GFF3 file. (EN)

Θετικές Επιστήμες

Θετικές Επιστήμες (EL)
Science (EN)

Ελληνική γλώσσα

Σχολή Θετικών Επιστημών » Τμήμα Βιολογίας » ΠΜΣ Βιοπληροφορική-Υπολογιστική Βιολογία » Κατεύθυνση Βιοπληροφορική-Υπολογιστική Βιολογία
Βιβλιοθήκη και Κέντρο Πληροφόρησης » Βιβλιοθήκη Σχολής Θετικών Επιστημών

https://creativecommons.org/licenses/by-nc/4.0/




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.