Συστήματα συστάσεων: αντιμετώπιση αραιών δεδομένων με παραγωγή εγγράφων χαρακτηριστικών

 
Το τεκμήριο παρέχεται από τον φορέα :

Αποθετήριο :
Διώνη
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2014 (EL)

Συστήματα συστάσεων: αντιμετώπιση αραιών δεδομένων με παραγωγή εγγράφων χαρακτηριστικών

Εφραιμίδης, Ζαχαρίας Η.

Τσιχριντζής, Γεώργιος

Με την εξάπλωση του Διαδικτύου δόθηκε η δυνατότητα σε κάθε ενδιαφερόμενο να επεκταθεί σε ευρύτερο κοινό. Άμεσα ξεκίνησε ο σχεδιασμός και η ανάπτυξη ολοκληρωμένων συστημάτων που να επιτρέπουν την απομακρυσμένη πρόσβαση των χρηστών σε κάθε είδους δεδομένα. Σύντομα παρήχθη πλεονάζουσα πληροφορία καθιστώντας αρκετά συστήματα δυσλειτουργικά, αφού οι χρήστες δυσκολεύονταν πλέον να εντοπίσουν ενδιαφέροντα στοιχεία. Έκτοτε έχει ξεκινήσει η αναζήτηση λύσεων, που να επιτρέπουν την περαιτέρω ανάπτυξη συστημάτων, χωρίς όμως να αποθαρρύνονται οι χρήστες τους. Τα συστήματα συστάσεων είναι μία από τις προτεινόμενες κατευθύνσεις προς τον στόχο αυτό, καθώς σκοπεύουν, μέσω διαφόρων τεχνικών, να προβλέψουν τον βαθμό αποδοχής κάθε στοιχείου από κάθε χρήστη και να κάνουν τις καταλληλότερες προτάσεις. Αν και οι τεχνικές ποικίλουν, ο βασικός τρόπος λειτουργίας σχετίζεται με τα υπάρχοντα δεδομένα του συστήματος, δηλαδή βασίζεται στα χαρακτηριστικά των στοιχείων ή των χρηστών, καθώς και τις μεταξύ τους αλληλεπιδράσεις, ώστε να προτείνει κατάλληλα στοιχεία στον εκάστοτε χρήστη. Ένα από τα σημαντικότερα προβλήματα των συστημάτων συστάσεων είναι τα αραιά δεδομένα. Δηλαδή παρατηρείται η έλλειψη μεγάλου ποσοστού από τα προαναφερθέντα χαρακτηριστικά, άλλοτε λόγω πρωτοεμφανιζόμενου χρήστη, όπου το σύστημα δεν έχει στη μνήμη του αρκετές πληροφορίες, και άλλοτε λόγω εσφαλμένης μοντελοποίησης των στοιχείων, με αποτέλεσμα η δομή τους να περιέχει κενές τιμές στα περιττά χαρακτηριστικά. Στην παρούσα εργασία για τη διαπίστωση αυτού του φαινομένου πραγματοποιείται μία πειραματική υλοποίηση αξιοποιώντας δεδομένα κινηματογραφικών ταινιών από MovieLens και IMDb. Στη συνέχεια επιδιώκεται η επίλυση του προβλήματος αυτού εξάγοντας θέματα από το σύνολο των χαρακτηριστικών με χρήση του αλγορίθμου latent Dirichlet allocation και περιγράφοντας τα στοιχεία ως μείγματα των θεμάτων.
The proliferation of the Internet has allowed every person to extend to a wider audience. The design and development of integrated systems that allowed users to remotely access any kind of data began. Soon redundant information was produced making systems quite dysfunctional, since most users had difficulty to find interesting data. Since then research has started for solutions which should allow further development of systems, but without discouraging their users. One of the suggested guidelines for this objective is the idea of recommender systems, which, through various techniques, try to predict the degree of acceptance of each item for each user and make appropriate recommendations. Although there is a broad range of techniques available, their basic function is associated with the system’s existing data, i.e. they are based on the features of the item or the user, and the interactions between them, in order to propose appropriate items to each user. One of the major problems of recommender systems is the data sparsity. A large proportion of the aforementioned features is missing, either because of the newcomer user, for whom the system has no memory, or due to incorrect modeling of the items, which makes their structure to consist of empty features. In order to confirm the existence of this problem an experimental solution is being developed by utilizing movies’ data from MovieLens and IMDb. Then the paper seeks to address this problem by extracting topics from the set of the features, using the latent Dirichlet allocation algorithm, and describing items as mixtures of topics.

Master Thesis

Artificial intelligence -- Mathematics
Recommender systems (Information filtering)
Εξόρυξη δεδομένων


Ελληνική γλώσσα

2014-12-02T08:28:41Z


Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.