Evaluation of coding synonymous SNPs in CpG sequences and exonic splicing enhancers in genes associated with type 2 diabetes: investigation in greek population

 
This item is provided by the institution :

Repository :
National Archive of PhD Theses
see the original item page
in the repository's web site and access all digital files if the item*
share



PhD thesis (EN)

2015 (EN)
Αξιολόγηση εξονικών πολυμορφισμών σε CpG αλληλουχίες και ενισχυτές ματίσματος σε γονίδια που συνδέονται με διαβήτη τύπου ΙΙ: διερεύνηση σε ελληνικό πληθυσμό
Evaluation of coding synonymous SNPs in CpG sequences and exonic splicing enhancers in genes associated with type 2 diabetes: investigation in greek population

Karambataki, Maria
Καραμπατάκη, Μαρία

Σύγχρονες μελέτες ευρείας κλίμακας διενεργούνται παγκοσμίως για τον προσδιορισμό των γενετικών χαρακτηριστικών (πολυμορφισμών) που αποτελούν προδιαθεσικούς παράγοντες για την εμφάνιση νοσημάτων πολυπαραγοντικών, συχνών ή και σπάνιων. Οι έρευνες που διενεργούνται στο πλαίσιο των ευρείας γονιδιωματικής συσχέτισης μελετών (GWAS, genome-wide association studies), στοχεύουν στη διερεύνηση σε ιδιαίτερα μεγάλο δείγμα του πληθυσμού όλων των πολυμορφισμών που έχουν καταγραφεί, ανεξάρτητα από την τυχόν συσχέτισή τους με συγκεκριμένες μεταβολές στις πρωτεΐνες που κωδικοποιούνται από τις αλληλουχίες στις οποίες εντοπίζονται, το πώς εκφράζονται οι πρωτεΐνες αυτές και από τυχόν άλλες παθολογικές καταστάσεις με τις οποίες μπορεί να συνδέονται. Ωστόσο, οι σύγχρονες γνώσεις στο πεδίο της λειτουργικής γονιδιωματικής επιτρέπουν πλέον, την πληρέστερη αξιολόγηση με τη χρήση της βιοπληροφορικής των γενετικών μεταβολών που μπορεί να επηρεάζουν την έκφραση, και συγκεκριμένα το μάτισμα των πρωτεϊνών. Είναι πλέον βέβαιο, ότι τέτοιες πληροφορίες μπορούν να βοηθήσουν σημαντικά στην επιλογή ενός μικρού αριθμού SNPs από μια πληθώρα πολυμορφισμών, που πιθανόν να οδηγούν σε αληθινά συνώνυμες μεταβολές, τουλάχιστον όσον αφορά στην κωδική περιοχή των γονιδίων. Μια από τις σημαντικότερες διαδικασίες ρύθμισης της γονιδιακής έκφρασης αποτελεί η παραγωγή ποικίλων προϊόντων ματίσματος με ελεγχόμενο τρόπο, που επιτρέπει τη χωροθέτηση και τη ρύθμιση των εμπλεκόμενων διαδικασιών. H διατριβή αυτή είχε ως στόχο να αναδείξει τη σημασία της επιλογής των θέσεων που έχουν λειτουργική σημασία για την έκφραση του γονιδίου, όχι στο επίπεδο της κωδικοποιούμενης πρωτεΐνης αλλά συγκεκριμένα στη ρύθμιση του ματίσματός του. Επιλέγοντας ως πρότυπο νόσημα τον «πολυπαραγοντικό» σακχαρώδη διαβήτη τύπου 2, αρχικά εντοπίσαμε τα «σημαντικά» για τη νόσο γονίδια και προσδιορίσαμε με τη χρήση εργαλείων βιοπληροφορικής, που αναφέρονται σε παραμέτρους της λειτουργικής γονιδιωματικής ένα μικρό αριθμό πολυμορφισμών, που βρίσκονται σε ρυθμιστικές για το μάτισμα θέσεις και θα μπορούσαν να έχουν σημαντικό ρόλο, να επηρεάζουν την λειτουργία των γονιδίων και τελικά να σχετίζονται με προδιάθεση για τη νόσο. Ως προϋπόθεση τέθηκε οι πολυμορφισμοί αυτοί να επιφέρουν σημαντικές μεταβολές σε εξονικές αλληλουχίες ματίσματος, και/ή να μεταβάλλουν το δυνητικό επιγενετικό προφίλ του DNA (να απαλείφουν ή να δημιουργούν αλληλουχίες CpG). Τόσο o έλεγχος της σχετικής βιβλιογραφίας, όσο και τα δικά μας πειραματικά αποτελέσματα απέδειξαν ότι η ύπαρξη πολυμορφισμών στις θέσεις αυτές δεν είναι ιδιαίτερα συχνή, αλλά συνοδεύεται από σημαντικά αυξημένη προδιάθεση για εμφάνιση διαβήτη τύπου 2, επιβεβαιώνοντας έτσι, την επιλογή αυτών των συγκεκριμένων πολυμορφισμών.Η πολυμορφικότητα των γονιδίων που σχετίζονται με το διαβήτη τύπου 2 ήταν αρκετά μεγάλη και οι πολυμορφισμοί που επιλέξαμε να μελετήσουμε ήταν συνώνυμοι πολυμορφισμοί, διότι είναι αυτοί που κατ’εξοχήν διαφεύγουν τον έλεγχο και θεωρούνται εκ των προτέρων ουδέτεροι. Από το σύνολο των 670 εξονικών μονονουκλεοτιδικών πολυμορφισμών των γονιδίων που σχετίζονται με τη νόσο, περίπου το 35% ήταν οι συνώνυμοι. Αντίθετα, η πολυμορφικότητα ήταν περιορισμένη στις σημαντικές για το μάτισμα θέσεις (κανονικές θέσεις ματίσματος και εξονικοί ενισχυτές ματίσματος) και στα εναλλακτικά ματιζόμενα εξόνια. Έτσι, στα γονίδια που συνδέονται με διαβήτη τύπου 2 δεν βρέθηκαν συνώνυμοι πολυμορφισμοί σε περιοχές ματίσματος στα όρια εξονιών-ιντρονίων (κανονικές θέσεις ματίσματος) και μόνο 10% των συνώνυμων εξονικών πολυμορφισμών βρίσκονταν σε εξονικούς ενισχυτές ματίσματος και εναλλακτικά ματιζόμενα εξόνια. Το γεγονός αυτό, πιθανότατα σημαίνει την ύπαρξη αυστηρών κανόνων επιτήρησης του ματίσματος σε γονίδια που σχετίζονται με τη διαδικασία διακίνησης της γλυκόζης. Εντούτοις, ιδιαίτερα υψηλή εμφανίζεται η πολυμορφικότητα των θέσεων μεθυλίωσης - θέσεις CpG στις ρυθμιστικές για το μάτισμα ακολουθίες. Έτσι, στα γονίδια που συνδέονται με διαβήτη τύπου 2 πάνω από τους μισούς (56%) συνώνυμους πολυμορφισμούς που επηρεάζουν σημαντικά το μάτισμα βρίσκονται σε θέσεις CpG. Αυτό, σε συνδυασμό με τα πρόσφατα ευρήματα που αποδεικνύουν τη λειτουργική συσχέτιση μεταξύ της μεθυλίωσης του DNA και του εναλλακτικού ματίσματος, διαμέσου της πρωτεΐνης CTCF, υποδηλώνει την ιδιαίτερη βαρύτητα που μπορεί να έχουν οι πολυμορφισμοί σε θέσεις CpG στη διαδικασία του ματίσματος.Από την αξιολόγηση των συνώνυμων εξονικών πολυμορφισμών που βρίσκονται σε ρυθμιστικές για το μάτισμα θέσεις, οδηγηθήκαμε σε δύο συνώνυμους πολυμορφισμούς στα γονίδια του διαβήτη τύπου 2 για τους οποίους διερευνήθηκε επίσης, πειραματικά η συσχέτισή τους με τη νόσο σε δείγμα του ελληνικού πληθυσμού: rs3749166, στο γονίδιο CAPN10 (καλπαΐνη 10) που κωδικοποιεί έναν αναδιαμορφωτή του μεταφορέα 2 της γλυκόζης και rs5404, στο γονίδιο SLC2A2 που κωδικοποιεί το μεταφορέα 2 της γλυκόζης.Και οι δύο συνώνυμοι πολυμορφισμοί που διερευνήθηκαν πειραματικά σχετίζονται με αυξημένη προδιάθεση για το διαβήτη τύπου 2. Συγκεκριμένα, ο πολυμορφισμός rs3749166(G>A) εμφανίζοται με το πολυμορφικό αλληλόμορφο A και τον ετερόζυγο γονότυπο AG να είναι επιβαρυντικοί για τη νόσο, ενώ ο μη πολυμορφικός γονότυπος GG εμφανίζεται ως προστατευτικός για τη νόσο. Ο πολυμορφισμός rs5404 (C>T) εμφανίζεται με το πολυμορφικό αλληλόμορφο Τ να είναι το προστατευτικό και εφόσον δεν απαντάται σε ομόζυγη κατάσταση στα δείγματά μας, λόγω της εξαιρετικά χαμηλής πληθυσμιακής συχνότητας του συγκεκριμένου γονότυπου TT, 0-1,7%, ο πολυμορφικός CT είναι ο προφυλακτικός και ο μη πολυμορφικός γονότυπος CC ο επιβαρυντικός για τη νόσο. Ο rs5404 στον ελληνικό πληθυσμό συνδέεται με την πολυμορφική θέση C/T και αποτελεί υποκατηγορία του πολυμορφισμού rs5404 με τα αλληλόμορφα G/A, που θεωρούνται κυρίαρχα στους διάφορους πληθυσμούς.Η σύγκριση των δύο πολυμορφισμών έδειξε ότι ο πολυμορφισμός rs3749166(G>A) και ιδιαίτερα το πολυμορφικό του αλληλόμορφο Α είναι το επιβαρυντικό σε σχέση με τον πολυμορφισμό rs5404 (C>T), όσον αφορά στην προδιάθεση για το διαβήτη τύπου 2 και στην ετερόζυγη μορφή του AG συνδέεται με νεότερη ηλικία διάγνωσης και εκδήλωσης της νόσου. Ωστόσο, η ρύθμιση του διαβήτη τύπου 2 εκφραζόμενη με τη γλυκόζη νηστείας δε φαίνεται να σχετίζεται με τους γονότυπους των δύο πολυμορφισμών, ενώ όσον αφoρά στη γλυκοσυλιωμένη αιμοσφαιρίνη ο επιβαρυντικός γονότυπος AGCC σχετίζεται με αυξημένες τιμές γλυκοσυλιωμένης αιμοσφαιρίνης σε σχέση με τους υπόλοιπους γονότυπους. Από τη μελέτη μας η απώλεια της θέσης επιγενετικής τροποποίησης-θέση CpG εμφανίζεται να συσχετίζεται είτε θετικά (rs5404) είτε αρνητικά (rs3749166) με τη νόσο, και συγκεκριμένα, η παρουσία της θέσης CpG έχει προφυλακτική επίδραση στην περίπτωση του πολυμορφισμού rs3749166 (αλληλόμορφο G προστατευτικό) και επιβαρυντική στην περίπτωση του πολυμορφισμού rs5404 (αλληλόμορφο C επιβαρυντικό). Αυτό υποδηλώνει ότι η εξελικτική απώλεια των θέσεων CpG μπορεί να είναι είτε προφυλακτική, είτε επιβαρυντική και δεν υπάρχει εκ των προτέρων επιλογή προς τη μια ή την άλλη κατεύθυνση, τουλάχιστον όσον αφορά πολυμορφισμούς που σχετίζονται με εκφυλιστικά νοσήματα, όπως ο διαβήτης τύπου 2.Η μελέτη μας οδήγησε στην επιβεβαίωση δύο συνώνυμων πολυμορφισμών στον ελληνικό πληθυσμό που σχετίζονται με το διαβήτη τύπου 2. Επίσης, η προσέγγιση αυτή ανέδειξε τη σημασία της επιλογής των θέσεων που έχουν λειτουργική σημασία για την έκφραση του γονιδίου και συγκεκριμένα τη ρύθμιση του ματίσματος και θα μπορούσε σε επόμενο στάδιο να παρέχει τη δυνατότητα πρόβλεψης του κινδύνου ανάπτυξης της νόσου για κάθε άτομο με βάση αυτή τη γενετική πληροφορία με τη χρήση αξιόπιστων μοντέλων πρόβλεψης. Τέλος, η γνώση μας αναφορικά με τους επιγενετικούς SNPs θα μπορούσε να αναδείξει την σημασία της εφαρμογής προληπτικών μέτρων με προφυλακτικό στόχο, για τους φορείς πολυμορφισμών που συνδέονται με αυξημένη προδιάθεση για τη νόσο.
Genome-wide approaches search the whole genome for causal genetic variants in order to identify heritable DNA modifications associated with various complex diseases. DNA polymorphisms studied by these approaches are independent of their relation with coding protein, protein expression and associated pathological conditions. However, most studies involve protein coding SNPs.Although such studies contribute considerably to the identification of disease-related heritable genetic variation, small and targeted studies can contribute to our understanding of the mechanisms involved in gene expression. In order to consider the impact of expression-related regulatory (splicing, epigenetic) parameters, the evaluation of genetic variation related to synonymous SNPs in splice-sites and serine-rich exonic splicing enhancers (SS and SR ESEs) and in epigenetic sites was undertaken in this dissertation.Splicing, as a disease-related condition, has been previously evaluated by bioinformatic tools in recent studies. Actually, in a previously published study we had identified several synonymous SNPs leading to major modifications of the splicing regulatory parameters (ESEs) and epigenetic (CpG) sites. Type 2 diabetes is associated with changes in the expression levels of several genes and also, synonymous SNPs may be actively involved in gene expression and their study could be useful in identifying key genetic variants associated with type 2 diabetes. One of the most important gene expression regulatory parameters is the production of various splice products - protein isoforms that allow the location and the regulation of the procedures involved. The aim of this study was to evaluate the importance of the site selection affecting gene expression and especially, splicing regulation.In the first part of the present dissertation, all genes reported in previous publications to be associated with type 2 diabetes were collected. Then, all synonymous SNPs observed in their coding sequences, their presence in alternative or constitutive exons and the formation or distraction of a CpG site by one of the alleles introduced by a SNP were recorded. Finally, the synonymous SNPs affecting splicing regulatory elements in DNA (SS and SR ESEs) by changing the splicing score were identified using bioinformatics tools and recorded. Synonymous SNPs that cause maximum splicing score changes of SS and SR ESEs were studied. Provided that synonymous SNPs are not frequent in ESEs, this analysis resulted in the identification of 232 (35%) synonymous polymorphisms from a total of 670 exonic SPNs, 73 (10%) of which are coding synonymous with major splicing effect in SS and SR ESEs, 8 (1.2%) of which were in alternative exons in genes associated with type 2 diabetes. More than half (56%) of ESE- related synonymous SPNs with major splicing effect were found in CpG sites, tentative DNA methylation sites. From these SNPs two were selected: rs3749166 in the CAPN10 gene (calpain 10), which encodes a nonlysosomal cysteine enzyme with a protease activity that acts as membrane transporter translocator modifying, among other activities, the activity of glucose transporter 4 and rs5404 in gene SLC2A2 (solute carrier family 2, member 2), a facilitated glucose transporter in liver and pancreatic islet β-cells. The first SNP, rs3749166, affects a splice-site ESE, while the second, rs5404, alters an ESE recognizing multiple SR proteins. The above SNPs were identified in a sample of the Greek population consisting of 45 males and 125 females, 71 of which were diagnosed with type 2 diabetes,the rest being the control group. In this sample the SNP rs3749166 (G>A) was observed in 67 diabetic patients and in 83 control subjects. This SNP was found to be associated with type 2 diabetes while the polymorphic allele A was related to high diabetic risk. The next SNP, rs5404(C>T) was detected in 16 diabetic patients and 39 control subjects and in this case, the polymorphic allele T of rs5404 appeared to be protective for type 2 diabetes while its genotype CC had enhanced disease risk. Genotype TT was not observed in any of the individuals in our sample (0-1.7%). Our results were in accordance with previous study, which has shown the association of rs3749166 with type 2 diabetes. Regarding the SNP rs5404, for which the results were controversial, the outcome was in accordance with previous study, which associated rs5404 with type 2 diabetes, although in another study the polymorphic allele rs5404 was only associated with enhanced risk for type 2 diabetes. In the presence of both rs3749166 and rs5404 in the diabetic patients, rs3749166 and especially, its polymorphic allele A, was associated with high risk predisposition for type 2 diabetes compared to rs5404. Additionally, genotype AG of rs3749166 was associated with disease diagnosis at a younger age and early disease onset. The critical regulatory markers of type 2 diabetes, fasting glucose and glycosylated hemoglobin were associated with disease complications (diabetic angiopathy and neuropathy) and high levels of glycosylated hemoglobin were related to deleterious genotype AGCC.In our study the removal of a CpG site was correlated either positively (rs5404) or negatively (rs3749166) with disease. Especially, the presence of a CpG site was protective in the case of rs3749166 (allele G protective) and harmful in the case of rs5404 (allele C deleterious) with respect to type 2 diabetes. This means, that evolutionary CpG sites loss might be protective or deleterious and there was no a-priori selection for the one or the other way, at least, as far as, genes associated with degenerative diseases, like type 2 diabetes is concerned.In our results, the frequency of synonymous exonic SPNs in splicing regulatory sites-ESEs and in alternative exons was low (high preservation), indicating the crucial role of these sites in gene function. The high frequency of synonymous exonic SPNs in epigenetic sites found, links DNA methylation with alternative splicing, proved the role of epigenetic SNPs in splicing and gene expression.Our study showed that two synonymous SNPs, selected according to bioinformative analysis on the basis of the functional genomic characteristics introduced in epigenetic and splicing regulatory elements were probably very significantly associated with type 2 diabetes susceptibility in the Greek population. The procedure presented for selecting SNPs affecting gene expression, could be useful for building risk-associated genotypes on the basis of biology predictive models and functional genetic studies, thus simplifying the procedures followed by large scale studies. Finally, our knowledge of epigenetic SPNs could promote the significance of adopting prevention programs for high-risk individuals for the disease.

Exonic splicing enhancers
Συνώνυμοι επιγενετικοί μονονουκλεοτιδικοί πολυμορφισμοί
Synonymous epigenetic SPNs
Εξονικοί ενισχυτές ματίσματος

Εθνικό Κέντρο Τεκμηρίωσης (ΕΚΤ) (EL)
National Documentation Centre (EKT) (EN)

Greek

2015


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ)
Aristotle University Of Thessaloniki (AUTH)



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)