Sequence-ready physical map of human chromosomal region 10q23.3-q25.1 and analysis of FRA10AC1 gene

RDF 

 
This item is provided by the institution :
University of Crete
Repository :
E-Locus Institutional Repository
see the original item page
in the repository's web site and access all digital files if the item*
share



Semantic enrichment/homogenization by EKT
2005 (EN)
Φυσικός χάρτης προς αλληλούχηση της περιοχής q23.3-q25.3 του χρωμοσώματος 10 του ανθρώπου και ανάλυση του γονιδίου FRA10AC1
Sequence-ready physical map of human chromosomal region 10q23.3-q25.1 and analysis of FRA10AC1 gene

Σαραφίδου, Θεολογία

Μοσχονάς, Νικόλαος

Στα πλαίσια του προγράμματος της χαρτογράφησης του γονιδιώματος του ανθρώπου, στο πρώτο μέρος αυτής της διατριβής κατασκευάσαμε το φυσικό χάρτη υψηλής ευκρίνειας των πλούσιων σε γονίδια, περιοχών q23.3-q25 και q26.2-qter του χρωμοσώματος 10, μήκους ~35 Mb που ισοδυναμεί με περίπου το ? του μήκους του χρωμοσώματος. Για την κατασκευή του χάρτη, αρχικά διερευνήσαμε μια ολική γενωμική βιβλιοθήκη κλώνων BAC χρησιμοποιώντας κατά ομάδες, ~500 μοναδιαία τμήματα DNA (STS) από τις ανωτέρω χρωμοσωμικές περιοχές ως ανιχνευτές, και απομονώσαμε 3350 διακριτούς χρωμοσωμο-ειδικούς κλώνους. Οι κλώνοι αυτοί, σε συνδυασμό με εκείνους που με την ίδια προσέγγιση είχαν απομονωθεί από τους συνεργάτες μας στο Sanger Centre, απετέλεσαν την χρωμοσωμο-ειδική βιβλιοθήκη του 10, αποτελούμενη συνολικά από ~18.000 BACs. Η διερεύνηση αυτής της βιβλιοθήκης με κάθε ένα από τα παραπάνω STS, ξεχωριστά, μας οδήγησε στην λεπτομερή και απόλυτα αξιόπιστη αντιστοίχιση κάθε BAC με μια ομάδα από STSs. Τα δεδομένα μας, σε συνδυασμό με αυτά που προέκυψαν από τον προσδιορισμό του προτύπου ενζυμικού τεμαχισμού των αντίστοιχων BACs (Sanger Centre UK, Washington University St. Louis US) χρησιμοποιήθηκαν για την κατασκευή κατ’ αρχήν, επιμέρους contigs (ομάδες αλληλοεπικαλυπτόμενων κλώνων) τα οποία, βάσει των STS που περιείχαν, χαρτογραφούνταν κατά μήκος των ανωτέρω χρωμοσωμικών περιοχών. Για την επέκταση και σταδιακή ενοποίηση των contigs, καθορίσαμε με χρωμοσωμικό «περπάτημα», περίπου 80 νέους μοριακούς δείκτες από τα άκρα των τελικών/εξωτερικών κλώνων των contigs με τελικό αποτέλεσμα την κατασκευή ενός ενιαίου, υψηλής ευκρίνειας φυσικού χάρτη για την περιοχή 10q23.3-q25, μήκους περίπου 28 Mb. Η αξιοπιστία της σχετικής τοπογραφίας κάθε γενωμικής θέσης προκύπτει από το «βάθος» του contig στη περιοχή, όπως καθορίζεται από τον αριθμό των επικαλυπτόμενων κλώνων που επιβεβαιώνουν τη σχετική θέση. Σε κάθε περίπτωση, τουλάχιστον 8 επικαλυπτόμενα, λεπτομερώς χαρακτηρισμένα BACs, καθόριζαν κάθε χρωμοσωμική θέση. Με παρόμοια προσέγγιση, συγκροτήθηκε ο φυσικός χάρτης της υποτελομερικής περιοχής αποτελούμενος από δύο contigs μεγέθους 4,6Mb και 2Mb. Η ολοκληρωμένη αλληλούχηση των περιοχών 10q23.3-q25 και 10q26.2-qter από τους συνεργάτες μας (εργαστήριο αυτόματης αλληλούχησης DNA, Sanger Centre UK) έγινε βάσει των παραπάνω χαρτών. Για το σκοπό αυτό, επιλέχθηκε και αλληλουχήθηκε μία σειρά κλώνων BAC (~300), οι οποίοι διατρέχουν τις εν λόγω χρωμοσωμικές περιοχές καθ’ όλο το μήκος τους, εμφανίζουν την μέγιστη αξιοπιστία ως προς την τοπογραφία τους και παρουσιάζουν την ελάχιστη δυνατή αλληλοεπικάλυψη (minimal tiling path). Πλέον, η πλήρης αλληλουχία στις αντίστοιχες περιοχές, που περιέχουν 272 από τα 816 γονίδια του χρωμοσώματος που κωδικοποιούν πρωτεΐνες και όπου χαρτογραφούνται 40 γενετικοί τόποι νοσημάτων, είναι σχεδόν ενιαία και ελεύθερα προσβάσιμη στο διαδίκτυο. Στο δεύτερο μέρος της διατριβής, αξιοποιήσαμε τον φυσικό χάρτη και την αλληλουχία του χρωμοσώματος 10 για να προσδιορίσουμε in silico, τον γονιδιακό χάρτη της περιοχής 10q23.3, μήκους 3Mb με στόχο τη ταυτοποίηση γονιδίων που σχετίζονται με παθολογικούς φαινοτύπους. Εστιαστήκαμε σε αυτή την υποπεριοχή λόγω της σύνδεσης της, εκτός άλλων, με α) το γενετικό τόπο της αυτοσωμικής επικρατούς μερικής επιληψίας του πλάγιου κροταφικού λοβού (ADLTE) και β) την έκφραση της εύθραυστης χρωμοσωμικής θέσης FRA10A. Μετά το χαρακτηρισμό μιας σειράς γονιδίων της περιοχής, στα πλαίσια του ευρωπαϊκού consortium για την ADLTE, δείξαμε ότι μεταλλαγές στο γονίδιο LGI1, ευθύνονται για την εκδήλωση της ασθένειας. Το LGI1 μαζί με τρία ακόμη γονίδια, συγκροτεί μια διασκορπισμένη στο γονιδίωμα, οικογένεια με κοινά χαρακτηριστικά τις πρωτεϊνικές επαναλήψεις EPT και το μερικώς επικαλυπτόμενο πρότυπο έκφρασης στον εγκέφαλο. Η γενετική ετερογένεια της ADLTE ή άλλες νευρολογικές ασθένειες, ίσως εξηγούνται από την ύπαρξη αυτών των παράλογων γονιδίων LGI. Επίσης, με in silico διερεύνηση της αλληλουχίας του χρωμοσώματος για τρινουκλεοτιδικές επαναλήψεις (CGG)n, ταυτοποιήσαμε το γονίδιο FRA10AC1 που σχετίζεται με την εύθραυστη θέση FRA10A, και προχωρήσαμε στο χαρακτηρισμό του. Η κυτταρογενετική έκφραση της FRA10A οφείλεται στην επέκταση κατά ~200 φορές, της πολυμορφικής επανάληψης (CGG)n της 5’ UTR του γονιδίου. Η επέκταση του (CGG)n οδηγεί στην υπερμεθυλίωση της περιοχής (αποτελέσματα από συνεργαζόμενο εργαστήριο) και συνεπάγεται την μεταγραφική καταστολή του γονιδίου. Το FRA10AC1 είναι μεταγραφικά ενεργό σε όλους τους ιστούς παρουσιάζοντας υψηλότερα επίπεδα έκφρασης σε όργανα με υψηλή μεταγραφική δραστηριότητα. Η ύπαρξη 5 εναλλακτικών μεταγράφων στις γονάδες, πιθανόν να συνεπάγεται αντίστοιχο αριθμό ισομορφών της πρωτεΐνης FRA10AC1, ετερογενών στο καρβοξυ-τελικό άκρο. Η πρωτεΐνη εντοπίζεται στον πυρήνα του κυττάρου και εμφανίζεται συντηρημένη στους πολυκύτταρους ευκαρυωτικούς οργανισμούς υποδηλώνοντας συμμετοχή σε μια βασική λειτουργία του κυττάρου. Με στόχο τη διερεύνηση του βιοχημικού ρόλου της πρωτεΐνης FRA10AC1, αξιοποιήσαμε το σύστημα των δύο υβριδίων στο σακχαρομύκητα που αποκάλυψε την αλληλεπίδρασή της με τις πρωτεΐνες SAP145 και DGCR14. Οι πρωτεϊνικές αλληλεπιδράσεις της FRA10AC1 επιβεβαιώθηκαν με προσεγγίσεις in vitro και σε κυτταροκαλλιέργειες. Και οι δύο πρωτεΐνες που ταυτοποιήθηκαν, φαίνεται να συμμετέχουν σε κοινή βιολογική λειτουργία, στη διαδικασία συναρμογής του mRNA. Πράγματι, η SAP145 αποτελεί υπομονάδα του παράγοντα συναρμογής SF3b, ο οποίος συμμετέχει στο σχηματισμό του U2 snRNP, συστατικό του μείζονος spliceosome και η DGCR14 έχει απομονωθεί βιοχημικά ως πρωτεΐνη-συστατικό του ίδιου συμπλόκου. Καθώς και οι δύο σχετίζονται με τη διαδικασία της συναρμογής του mRNA, τα αποτελέσματά μας συνηγορούν στην συμμετοχή της FRA10AC1 σε αυτήν την διαδικασία ή εναλλακτικά σε άλλες λειτουργικά συσχετιζόμενες, διαδικασίες σύνθεσης, επεξεργασίας ή/και διακίνησης του mRNA. (EL)
In the first part of this thesis, we constructed a high resolution, sequence-ready, physical map of the gene-rich regions q23.3-q25 and q26.2-qter of human chromosome 10. These regions comprise about 35 Mb, i.e. about ? of the length of the chromosome. For the map construction, we initially screened a grided human BAC library, using about 500 distinct sequence tagged sites (STSs) from the above regions as probes, divided in groups, and isolated 3350 distinct, chromosome 10 specific BACs. Our clones, together with those similarly isolated by our Sanger Centre collaborators, formed the human chromosome 10 specific library, consisting of ~18.000 BACs. Screening of this library with each one of the above STSs, led us to the detailed and highly confident correlation of each one of the BACs with a group of STSs. We used these data, in combination with those derived from the BAC fingerprinting analysis (Sanger Center UK, Washington University St. Louis US) for the construction of the preliminary contigs (groups of overlapping clones) mapped along the above chromosomal regions. For the extension and progressive merging of the contigs, we determined by chromosome walking, about 80 new STS-markers, derived from the end-sequences of the most distal clones of each contig. This task gradually resulted in the construction of a unique, high resolution physical map of 10q23.3-q25, with a length of approximately 28 Mb. Contig depth, as defined by the number of overlapping clones in every map position, confidently supports the relative topography of each genomic site. In our map, mapping of each position was supported by at least 8 overlapping, well-characterized, BACs. Similarly, in terms of strategy and confidence, the physical map of the subtelomeric region was constructed, consisting of two contigs, 4.6 Mb and 2 Mb in length. Our mapping data were exploited by the collaborating laboratory of automated DNA sequencing (Sanger Center, UK), initially for the construction of a minimal tiling path of about 300 BACs mapped with the highest confidency, and subsequently, for the complete sequencing of the above regions. The corresponding finished sequence, currently available freely through the network, has a total size of about 35 Mb, consists of 272 out of 816 chromosome 10 protein coding genes and is associated with 40 disease-related genetic loci. With the aim to identify disease-related genes, in the second part of this thesis, we exploited both physical mapping and sequencing data to construct in silico, the genic map of a 10q23.3 region, 3 Mb in length. Among others, this area is associated with i) the genetic locus of the autosomal dominant lateral temporal lobe epilepsy (ADLTE), and ii) the expression of the cytogenetic fragile site FRA10A. In collaboration with other labs, altogether forming the European Consortium of ADLTE, we characterized several ADLTE candidate genes. Among those, LGI1 was determined to be directly associated with the disease, since it was found mutated in patients of ADLTE families. LGI1 a gene of unknown function, belongs to a novel gene family consisting of four members (LGI1-4) dispersed in the genome. All LGI genes are active in the brain displaying a partially overlapping pattern of expression; the encoded proteins are characterized by a variable number of tandemly linked EPT repeats possibly involved in protein-protein interactions. It is reasonable to hypothesize that the characteristic genetic heterogeneity of ADLTE or other neurological diseases may be related with members of the LGI family. Finally, by in silico screening of the nucleotide sequence of chromosome 10 for (CGG)n repeats, we identified a novel gene, FRA10AC1, carrying a polymorphic (CGG)n repeats in its 5’ UTR and showed its direct involvement with the manifestation of FRA10A fragile site. Indeed, FRA10A carriers display expansion of the (CGG)n repeat by approximately 200-fold. This expansion, as shown by a collaborating group, results in hypermethylation of the region and the consequent transcriptional silencing of the gene. FRA10AC1 transcripts are detected ubiquitously in human tissues, being more abundant in organs with highly transcriptional activity. The presence of FRA10AC1 alternative transcripts in gonads, suggested the existence of five protein isoforms displaying structural heterogeneity at their carboxy-terminus. FRA10AC1 protein is accumulated in the nucleoplasm and remains well-conserved in multi-cellular eukaryotes, implying participation of the FRA10AC1 in a fundamental cellular function. In order to investigate its biochemical role, using the yeast two-hybrid system, we showed that FRA10AC1 interacts with two proteins, SAP145 and DGCR14 and verified our finding by in vitro and cell culture assays. According to the recent literature, both interacting proteins are involved in the process of pre-mRNA splicing. Indeed, SAP145 is a subunit of the SF3b splicing factor participating in the formation of U2 snRNP, a component of the major spliseosome. Furthermore, DGCR14 has been repeatedly isolated by biochemical approaches, as a component of the same complex. Therefore, it is reasonable to believe that our data support a functional role of FRA10AC1 in the pre-mRNA splicing machinery or, its involvement in functionally linked procedures, i.e. synthesis, processing and nucleo-cytoplasmic transport of mRNA. (EN)

text

Πανεπιστήμιο Κρήτης (EL)
University of Crete (EN)

2005-12-14
2006-04-13




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)