Κάθε οργανισμός αποτελείται από κύτταρα. Τα κύτταρα είναι πολύπλοκα, βιολογικά συστήματα των οποίων η ύπαρξη και η ανάπτυξη εξαρτάται από χιλιάδες αλληλεπιδράσεις μεταξύ των μορίων του κυττάρου (πχ γονίδια, πρωτείνες, χημικά συστατικά κτλ). Αυτές οι αλληλεπιδράσεις συνήθως μοντελοποιούνται με τη βοήθεια γράφων, όπου οι κόμβοι αναπαριστούν τα μόρια ενώ οι ακμές τις αλληλεπιδράσεις μεταξύ των μορίων. Μέχρι σήμερα έχουν μελετηθεί λεπτομερώς τουλάχιστον τέσσερα διαφορετικά είδη βιολογικών δικτύων: τα gene-regulatory networks, τα protein-protein interaction networks, τα signal transduction networks και τα metabolic interaction networks.
Η παρούσα εργασία επικεντρώνεται στην ανάλυση και οπτικοποίηση των metabolic networks. Τα metabolic networks αναπαριστούν το σύνολο των αντιδράσεων που λαμβάνουν χώρα σε ένα κύτταρο με σκοπό την διατήρηση της ζωής. Οι βιο-χημικές αντιδράσεις παράγουν ένα σύνολο με ένα ή περισσότερα προϊόντα από ένα σύνολο με ένα ή περισσοτερα αντιδρώντα. Η αναπαράσταση των metabolic networks με την χρήση γράφων, συχνά επιφέρει διάφορα προβλήματα. Για παράδειγμα, σε μία αντίδραση αντιμετωπίζοντας κάθε μεταβολίτη ξεχωριστά, οι εξαρτήσεις μεταξύ των μεταβολιτών χάνονται. Καθώς μία αντίδραση μπορεί να έχει ένα ή περισσοτερα αντιδρώντα ή/και ένα ή περισσότερα πρϊόντα, η ακμή που αναπαριστά την αντίδραση είναι στην πραγματικότητα μία υπερ-ακμή και το metabolic network ένας υπερ-γράφος. Ένας υπερ-γράφος είναι μια γενίκευση ενός απλού γράφου, όπου μία υπερ-ακμή μπορεί να συνδέει έναν ή περισσότερους κόμβους.
Δυστυχώς η ανάλυση και οπτικοποίηση των metabolic networks με την χρήση υπερ-γράφων δεν είναι απλή διαδικασία. Η δυσκολία οφείλεται στην πολυπλοκότητα και στις ιδιαιτερότητες των δικτύων αυτών καθώς επίσης και στην περιορισμένη βιβλιογραφία αναφορικά με την οπτικοποίηση υπερ-γράφων. Για την εξέταση του προτεινόμενου μοντέλου, αναπτύχθηκε ένα εργαλείο,το VisBolic, το οποίο αναλύει και οπτικοποιεί τα metabolic networks ενώ επιτρέπει την εκτέλεση προκαθορισμένων επερωτήσεων στην βάση. Τα δεδομένα προέρχονται από την βάση δεδομένων του KEGG, και βρίσκονται αποθηκευμένα σε flat αρχεία. Τα δεδομένα αυτά, αφού υπέστησαν μία αρχική επεξεργασία, στη συνέχεια αποθηκεύτηκαν σε μία σχεσιακή βάση δεδομένων, καθιστώντας εφικτή την ανάλυσή τους με υπολογιστή.
(EL)
Every biological organism consists of cells. Cells are complex, biological systems whose
growth and existence depends on thousands of biological interactions between the molecules
(genes, proteins, chemical compounds etc). These interactions are typically modelled as graphs,
where nodes represent the molecules and edges the interactions between the molecules. Many
important biological networks have been discovered through laboratory studies. To date, at
least four types of biological networks have been characterized in detail: the gene regulatory
networks, the protein-protein interaction networks, the signal transduction networks and the
metabolic interaction networks.
This thesis focuses on the analysis and visualization of metabolic networks. Metabolic networks
represent the set of chemical reactions that happen in a cell to maintain life. Biochemical
reactions are processes that lead to the transformation of one set of chemical substances (called
reactants or substrates) to another set (called products). A variety of problems arise in analysing
and representing that knowledge using a graph-based model. For example, by treating each
metabolite in a reaction separately, dependences between metabolites are lost. Since a reaction
may have one or more substrates or one or more products, the edge representing a reaction is
actually a hyperedge. Thus, the metabolism is better represented by hypergraphs. A hypergraph
is a generalization of an ordinary graph where a hyperedge can connect more than two
vertices.
Unfortunately, the hypergraph based analysis and visualization of metabolic networks was
proven not a simple task, due to the complexity and the particularities of metabolic networks
and due to the lack of literature on hypergraph drawing. For testing our approach a tool, called
VisBolic (VISualization of MetaBOLIC pathways), has been developed. The tool analyses and
visualizes metabolic pathways while allows the execution of predefined but meaningful queries
on metabolism. The metabolic network data come from KEGG database, where the data are
stored in flat files. Therefore, the data were firstly preprocessed and then were stored in a
relational database, making them amenable to computer analysis.
(EN)