Στις μέρες μας, είναι, πλέον, ευρέως γνωστά τα οφέλη της άσκησης και η επιτακτικότητα ένταξής της στην καθημερινότητά μας. Τόσο από ιατρικής όσο και από ψυχολογικής άποψης, η βελτίωση της φυσικής μας κατάστασης, μοιάζει να αποτελεί τη λύση σε ένα μεγάλο εύρος καταστάσεων που καλούμαστε να αντιμετωπίσουμε καθημερινά. Μάλιστα, τα τελευταία χρόνια, παρουσιάζεται μια γενικότερη παγκόσμια τάση προς έναν πιο υγιεινό τρόπο ζωής. Αυτό εκφράζεται τόσο μέσω διατροφικών επιλογών αλλά, φυσικά, και άνθιση των γυμναστηριακών δραστηριοτήτων. Μάλιστα, η ποικιλία και το εύρος επιλογών ως προς τη μορφή, την ένταση και τον τρόπο εκγύμνασης, έτσι ώστε να εξυπηρετούνται οι στόχοι αλλά και οι προσωπικές προτιμήσεις του καθενός.
Βασικός σκοπός διεξαγωγής της συγκεκριμένης έρευνας είναι η ανάπτυξη και η συγκριτική αξιολόγηση τριών διαφορετικών μοντέλων αλγορίθμων:
1. ΚΝΝ (K Nearest Neighbors),
2. Random Forest Classifier &
3. XGBoost Classifier , με στόχο την ανάδειξη του ακριβέστερου μοντέλου σύστασης στην διαδικασία επιλογής τρόπου εκγύμνασης. Οι διαδικασίες επεξεργασίας, ανάλυσης και πρόβλεψης των δεδομένων πραγματοποιήθηκαν με τη χρήση βιβλιοθηκών και εργαλείων "Python".
Φυσικά, πρέπει να αναφέρουμε πως για την διεκπαιρέωση της παραπάνω διεργασίας απαιτείται μελέτη και κατανόηση της φυσικής κατάστασης & των επίπεδων εκγύμνασης του πληθυσμού στις μέρες μας, των επικρατέστερων μεθόδων προπόνησης καθώς αναγνώριση και ανάλυση των παραγόντων που επηρεάζουν τα επίπεδα αυτά.
Συνοψίζοντας τα αποτελέσματα της μελέτης, κατανοούμε πως δεν υπάρχει μοντέλο σύστασης με ξεκάθαρη υπεροχή σε όλες τις μορφές άσκησης. Αν αναγκαζόμασταν να επιλέξουμε ένα και μοναδικό σύστημα πρόβλεψης για όλες τις μορφές άσκησης, πιθανότατα η επικρατέστερη επιλογή να ήταν η μέθοδος XGBoost, επειδή οι περισσότερες μορφές άσκησης ανήκουν στην κατηγορία που η συγκεκριμένη μέθοδος καλύπτει στον πιο αποτελεσματικό βαθμό, αλλά και επειδή ακόμα και στις κατηγορίες που δεν κατάφερε να αποδώσει σε επίπεδα ακριβείας ίσα με τα μέγιστα, οι προβλέψεις της δεν ήταν σε καμία κατηγορία οι ελλιπέστερες, ή δεν παρουσίαζαν ανησυχητικές αποκλίσεις από την καλύτερη επιλογή.
Όμως, η καλύτερη δυνατή επιλογή που θα μπορούσαμε να κάνουμε, είναι να αναγνωρίσουμε τα δυνατά σημεία της κάθε μεθόδου και να αναθέσουμε τις προβλέψεις ανά μορφή άσκησης στη μέθοδο εκείνη που μπορεί να ανταποκριθεί καλύτερα. Η κάθε μέθοδος ανταποκρίνεται καλύτερα σε διαφορετικά δεδομένα, σε διαφορετικές μεταβλητές και τύπους προβλημάτων. Είναι ίσως ανώφελο να αναζητάμε μια βέλτιστη λύση σε όλα τα προβλήματα πρόβλεψης. Αντίθετα, το πιο σοφό και επαγγελματικό, είναι να αναθέσουμε στη κάθε μέθοδο την κατηγορία εκείνη στην οποία οι υποβόσκουσες μέθοδοι και τα συστήματα που χρησιμοποιεί ταιριάζουν άριστα και οδηγούν στις ακριβέστερες προβλέψεις.
(EL)
Nowadays, the positive effects of exercise and the imperative of including it in our daily life are widely known. Both from a medical and psychological point of view, improving our physical condition seems to be the solution to a wide range of situations that we have to deal with every day. In fact, in the last years, there has been a general global trend towards a healthier lifestyle. This is impacting both dietary choices of the population but also the physical activities that people tend to participate to. There is a wide variety and range of options in terms of form, intensity and training method, so that everyone's goals and personal preferences are served.
The main purpose of conducting this research, is the development and comparative evaluation of three different algorithm models:
1. KNN (K Nearest Neighbors),
2. Random Forest Classifier &
3. XGBoost Classifier, used as recommendation systems and aiming to highlight the most accurate one, in the exercise mode selection process, based on personal needs and motivation. Data processing, analysis and predictions were performed using Python libraries and tools.
Of course, we must mention that successfully complete the above process, a study and understanding of the physical condition & fitness levels of the population today, the prevailing training methods as well as recognition and analysis of the factors that influence these levels was required.
To sum up the results of the study, we came to the conclusion that none of the recommendation systems performed with a clear superiority in all forms of exercise. If we had to choose one single prediction system for all forms of exercise, most likely, the best choice available would be XGBoost, as it appears to have the highest accuracy results in most of the forms of exercises that we applied the prediction models to. But also, even in the categories that XGBoost failed to perform at the maximum levels of precision, its predictions were not incomplete, or did not show alarming deviations from the best option.
In conclusion, the best possible choice would be to recognize the strengths of each method and assign the predictions by form to the method that can respond the best. Each method responds best depending on different data, different variables, and types of problems. It is perhaps futile to seek one optimal solution to all recommendation problems. Instead, the most effective thing to do is to acknowledge the benefits and the downsides of each algorithm and assign each form of training to the specific recommendation system that fits perfectly and leads to the most accurate predictions.
(EN)