Η λοίμωξη COVID-19, υπεύθυνος για την οποία είναι ο πρωτοεμφανιζόμενος κορονοϊός SARS- CoV2, εμφανίστηκε στην Κίνα κατά το τέλος του 2019 και έκτοτε έχει λάβει διαστάσεις πανδημίας, σύμφωνα με τον Παγκόσμιο Οργανισμό Υγείας (World Health Organization- W.H.O.). Οι σύγχρονες εφαρμογές της πληροφορικής και ειδικότερα ο κλάδος των μεγάλων δεδομένων συνεισφέρουν σημαντικά στη διαχείριση των πληροφοριών σχετικά με τα περιστατικά λοίμωξης από τη νόσο, όπως αυτά καταγράφονται από τις δομές δημόσιας υγείας αλλά και ιδιωτικές ειδησεογραφικές ιστοσελίδες.
Στο πλαίσιο της παρούσας διπλωματικής εργασίας έχει πραγματοποιηθεί η συλλογή μεγάλων δεδομένων για την COVID-19 σε περιοχές της Ελλάδας για το χρονικό διάστημα από 01/01/2020 έως και 27/05/2021, μέσα από ελληνικούς ειδησεογραφικούς ιστοχώρους, έτσι ώστε να είναι δυνατή η εξαγωγή πληροφοριών για τα κρούσματα COVID-19 στην Ελλάδα (με βάση την ημερομηνία, την τοποθεσία και τον αριθμό των κρουσμάτων). Στη συνέχεια δημιουργήθηκαν διαδραστικές οπτικοποιήσεις για να παρουσιαστούν τα παραπάνω δεδομένα με τρόπο όσο γίνεται πιο κατανοητό στο ευρύ κοινό.
Για την υλοποίηση της εργασίας χρησιμοποιήθηκαν η γλώσσα προγραμματισμού Python και το εργαλείο προγραμματισμού Jupyter Notebook. Συνολικά, συλλέχθηκαν 284.688 ιστοσελίδες από ιστοχώρους όπως οι in.gr, tovima.gr, tanea.gr και protothema.gr. Στη διαδραστική οπτικοποίηση των δεδομένων δίνεται η δυνατότητα στους χρήστες να φιλτράρουν τα δεδομένα σύμφωνα με διάφορα κριτήρια καθώς και να συγκρίνουν ακόμα και γεωγραφικά διαμερίσματα της Ελλάδας ως προς τον αριθμό κρουσμάτων από τη λοίμωξη COVID-19.
(EL)
COVID-19, responsible for which is the debutant coronavirus SARS-Cov2, appeared in China at the end of 2019 and has since received dimensions of pandemic, according to the World Health Organization – W.H.O. Contemporary applications of informatics, especially in the field of big data, contribute significantly to information management about cases of infection by the disease, as these are recorded by structures of public health and private news webpages.
In the context of this thesis, data was collected from Greek news websites about COVID-19 infection cases in the various areas of Greece, for the period from 01/01/2020 to 27/05/2021. The goal has been to extract information on COVID-19 cases in Greece (based on the date, location and number of cases) and proceed to create interactive visualizations to present the above data in a manner that is as understandable as possible to the general public.
The thesis was implemented using the Python programming language and the Jupyter Notebook programming tool. In total, 284,688 webpages were collected from websites such as in.gr, tovima.gr, tanea.gr and protothema.gr. The interactive visualization of the data provides users with the ability to filter the data according to various criteria as well as to compare geographical regions of Greece in terms of the number of cases of COVID-19 infection.
(EN)