A predictive analysis on heart diseases using machine learning techniques with the R tool

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Διώνη
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2021 (EL)

Εφαρμογή μοντέλων πρόβλεψης με χρήση του εργαλείου της R για την πρόβλεψη εμφάνισης καρδιακών προβλημάτων σε ασθενείς
A predictive analysis on heart diseases using machine learning techniques with the R tool

Μπατσιάκος, Γεώργιος

Φιλιππάκης, Μιχαήλ
Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων
Πληροφοριακά Συστήματα και Υπηρεσίες

Σύμφωνα με στατιστικές μελέτες και τον οργανισμό των κέντρων ελέγχου και πρόληψης νοσημάτων CDC (Centers for Disease Control and Prevention), που αποτελεί τον μεγαλύτερο οργανισμό δημόσιας υγείας των Ηνωμένων Πολιτειών της Αμερικής, οι καρδιακές ασθένειες (heart diseases) αποτελούν ένα από τα κυριότερα αίτια θανάτου στην Αμερική αλλά και στον υπόλοιπο κόσμο. Συγκεκριμένα περισσότεροι από εξακόσιες χιλιάδες άνθρωποι χάνουν την ζωή τους λόγω κάποιας μορφής καρδιακής παθήσεως ετησίως, ένα ποσοστό που ανάγεται σε περίπου το ¼ των θανάτων συνολικά. Ο όρος των καρδιακών ασθενειών μπορεί να αναφέρεται σε διάφορες μορφές παθήσεων με τον κυριότερο αυτών να είναι η στεφανιαία νόσος (Coronary Artery Disease). Η στεφανιαία νόσος είναι η πιο συνηθισμένη καρδιακή ασθένεια που συναντάται σε μεγάλο μέρος των καρδιακά νοσούντων. Συγκεκριμένα το 2017 υπήρξαν περίπου 365 χιλιάδες θάνατοι που οφείλονταν στην συγκεκριμένη πάθηση ενώ περίπου το 7% των ανθρώπων ηλικίας άνω των 20 εμφανίζουν την εν λόγω ασθένεια. Ο κύριος τρόπος αντιμετώπισης αυτών των παθήσεων είναι η πρόληψη και η πρόγνωση της ώστε να αντιμετωπισθεί προτού κυρίως εμφανιστεί. Σε περίπτωση παθήσεως η κύρια αντιμετώπιση αφορά πάλι σε αλλαγή συνηθειών και τρόπου ζωής. Όπως είναι λοιπόν εμφανές μια τέτοια πάθηση με μεγάλο βαθμό βαρύτητας είναι άκρως σημαντικό να μπορεί να προβλεφθεί σύμφωνα με συμπτώματα και στοιχεία που μπορεί να σχετίζονται με την εμφάνιση της. Μιλώντας για πρόγνωση αναφερόμαστε σε πρόβλεψη των πιθανοτήτων εμφάνισης της ασθένειας σύμφωνα και με άλλα δεδομένα. Στην σημερινή λοιπόν πραγματικότητα, όπου τα δεδομένα αποτελούν πλέον τον πυρήνα των διαδικασιών σε όλο το φάσμα της καθημερινότητας, η πιο χρήσιμη και βάσιμη μέθοδος για την πρόβλεψη είναι η εξόρυξη δεδομένων με την εφαρμογή των μεθόδων μηχανικής μάθησης (machine learning). Μέσω της μηχανικής μάθησης έχουμε πρόσβαση σε μια πληθώρα αλγορίθμων που προσδίδουν ακρίβεια και ευελιξία για την ανάλυση των δεδομένων και την πρόβλεψη μέσω αυτών. Στην παρούσα εργασία θα προσπαθήσουμε μέσω της εξόρυξης και της διερεύνησης των δεδομένων, της οπτικοποίησης αυτών και της εφαρμογής αλγορίθμων μηχανικής μάθησης σε ένα συγκεκριμένο σύνολο(dataset) να κατανοήσουμε την σχετικότητα των μεταβλητών με την παρουσία καρδιακών παθήσεων και να χαρακτηρίσουμε την σχετικότητα της εμφάνισης αυτών με την παρουσία άλλων συμπτωμάτων και την ασφάλεια πρόβλεψης της καρδιακής πάθησης μέσω αυτών.
According to statistical analysis provided from the organization of CDC (Centers for Disease Control and Prevention), which is the most important organization of public health in the United States of America heart disease is one of, if not the most critical causes of death not only in America but in the whole world. Specifically more than 600.000 of people are affected and end up losing their life from some kind of heart disease. That is about 7 percent and almost the ¼ of the total annual deaths in America and the rest of the world. The terminology given as heart disease refers to different types of conditions with the most crucial and common amongst them being the Coronary Artery Disease. This type of disease is the most usual and commonly found in the samples of heart disease patients. In particular, in the year 2017 there was about 365 thousands of deaths caused by CAD whereas around 7 percent of the people over 20 years old have this specific disease. The main way of dealing with that kind of conditions are prediction and forecasting of them via the symptoms or other relevant characteristics so that it is avoided. In case it is not timely predicted the only countermeasures are the change of habits and way of life. As easy as is to see then this type of disease is crucial and most important to be predicted via the symptoms and the characteristics which are relevant, so that more lives are saved. Regarding forecasting we are referencing the prediction of the possibility of people having CAD or in general heart diseases in correlation with other characteristics. In today’s world and reality, where data are in the center of processes in every aspect of the world, the most reliable and accountable method for prediction is data mining using machine learning algorithms. Through machine learning we have access in a great variety of algorithms which provide accuracy and flexibility for analyzing data and predicting possible outcomes. In the aforementioned paper we will try using methods of data mining and exploratory analysis and by visualizing the data to apprehend the correlation of the variables with the appearance of heart disease, we will understand the connection of other symptoms with them and how accurate we can predict a heart disease through the correlated variables.

Master Thesis

Data exploration
Data analysis
Heart disease
Μηχανική μάθηση
Αλγόριθμοι
Ανάλυση δεδομένων
Διερεύνηση δεδομένων
Data mining
Καρδιακές παθήσεις
Εξόρυξη δεδομένων


Ελληνική γλώσσα

2022-02-28
2021-09
2022-04-05T05:45:19Z


Πανεπιστήμιο Πειραιώς

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.