Παραγωγή δεδομένων μεγάλου όγκου με Διαφορική Ιδιωτικότητα

Παραγωγή δεδομένων μεγάλου όγκου με Διαφορική Ιδιωτικότητα

URI: https://www.openarchives.gr/aggregator-openarchives/edm/dias/000058-84556
RDF/XML JSON-LD

Το τεκμήριο παρέχεται από τον φορέα :

Πολυτεχνείο Κρήτης

Αποθετήριο :
Ιδρυματικό Αποθετήριο Πολυτεχνείου Κρήτης

δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου^*

κοινοποιήστε το τεκμήριο

Σημασιολογικός εμπλουτισμός από το EKT

ΕΚΤ τύπος τεκμηρίου

Πτυχιακή εργασία (EL)

ΕΚΤ xρονολογία

2020 (EL)

EKT Ιστορική περίοδος

Τίτλος

Παραγωγή δεδομένων μεγάλου όγκου με Διαφορική Ιδιωτικότητα (EL)

Large Differentially Private Data Synthesis (EN)

Δημιουργός

Ζαχαριουδακης Χρηστος (EL)

Zacharioudakis Christos (EN)

Συντελεστής

Πολυτεχνείο Κρήτης (EL)

Technical University of Crete (EN)

Basilios Samoladas (EN)

Minos Garofalakis (EN)

Antonios Deligiannakis (EN)

Περιγραφή

Στις μέρες μας, δεδομένα υπάρχουν σε αφθονία, αυξάνονται με ραγδαίους ρυθμούς και έχουν ποικίλες χρήσεις. Μια από τις πρόσφατες χρήσεις των δεδομένων είναι η εκπαίδευση μοντέλων Μηχανικής Μάθησης, λογισμικού με την δυνατότητα να λαμβάνει δικές του αποφάσεις. Ωστόσο, η χρήση δεδομένων για την εκπαίδευση των μοντέλων αυτών προκαλεί ανησυχίες σε ό,τι αφορά την ιδιωτικότητα των ατόμων, ειδικά όταν πρόκειται για πολύ ευαίσθητα δεδομένα όπως ιατρικά δεδομένα. Μια λύση στο πρόβλημα αυτό αποτελεί η παραγωγή συνθετικών δεδομένων, η δημιουργία ψεύτικων δεδομένων που αντιπροσωπεύουν όμως τα πραγματικά. Ωστόσο, η παραγωγή συνθετικών δεδομένων παρέχει ελάχιστες εγγυήσεις ιδιωτικότητας. Επομένως αυξάνεται η ανάγκη για έναν ισχυρό και μαθηματικά αυστηρό ορισμό της ιδιωτικότητας που συνοδεύεται από μια κλάση υπολογιστικά εκτελέσιμων αλγορίθμων. Ένας τέτοιος ορισμός είναι η Διαφορική Ιδιωτικότητα. Η εργασία αυτή αποσκοπεί στο να συνδυάσει την έννοια της Διαφορικής Ιδιωτικότητας με διάφορες τεχνικές Μηχανικής Μάθησης, ώστε να παραχθούν δεδομένα που είναι πραγματικά ιδιωτικά και μπορούν να χρησιμοποιηθούν αποτελεσματικά στην θέση των πραγματικών δεδομένων. Τα μοντέλα Μηχανικής Μάθησης που θα μας απασχολήσουν είναι τα Bayesian Networks και τα Generative Adversarial Networks. (EL)

In our days, data exists in abundance, it is ever increasing and it finds numerous uses. A most recent use is the training of Machine Learning models, software capable of making their own decisions. However, using data to train said models raises significant privacy concerns, especially when it comes to highly sensitive data such as medical records. A solution to this predicament is the synthetic data generation, the production of “fake” data that resembles the real one. However, synthetic data generation does not provide any privacy guarantees on its own. The need increases for a robust, meaningful, and mathematically rigorous definition of privacy, together with a computationally rich class of algorithms that satisfy this definition. One such definition is Differential Privacy. This thesis attempts to combine the concept of Differential Privacy with various Machine Learning techniques to generate truly private data that can be utilized in place of the real one effectively. The Machine Learning models that will concern us are the Bayesian Networks and the Generative Adversarial Networks. (EN)

Τύπος

bachelorThesis

Θέμα

Differential privacy (EN)

Data synthesis (EN)

Machine learning (EN)

Πάροχος

Πολυτεχνείο Κρήτης

Αποθετήριο / συλλογή

Ιδρυματικό Αποθετήριο Πολυτεχνείου Κρήτης

Επιμέρους συλλογή

Technical University of Crete - Diploma Works

Γλώσσα

Αγγλική γλώσσα

Ημερομηνία έκδοσης

2020

Προσδιοριστής

http://purl.tuc.gr/dl/dias/B3CEC19D-7593-4E6F-97EE-591C237D6B6310.26233/heallink.tuc.84556

Εκδότης

Πολυτεχνείο Κρήτης::Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών (EL)

Technical University of Crete::School of Electrical and Computer Engineering (EN)

*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.

Παραγωγή δεδομένων μεγάλου όγκου με Διαφορική Ιδιωτικότητα

Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.