Επισκόπηση της εξόρυξης δεδομένων: η περίπτωση της ανίχνευσης απάτης

 
see the original item page
in the repository's web site and access all digital files if the item*
share




2008 (EN)
A review of data mining: the case of fraud detection
Επισκόπηση της εξόρυξης δεδομένων: η περίπτωση της ανίχνευσης απάτης

Λαφτσίδης, Μιχάλης Σταύρου

The advances in computer science provided the scientists with the opportunity to develop new methods and techniques, changing thus the calculatingly intensive algorithms into feasible solutions. Simultaneously however, the easy with which we can assemble and store data in a digital way has created bulky and continuously growing databases. This fact can be observed in various sectors of society as the health, the trade, the economy, the telecommunications, but also in the most extraordinary regions of science as the astronomy and the pictures of astronomical bodies. It is not therefore strange the interest of the scientific community in finding techniques and methods for exporting information from these variform and enormous databases. The advances in computer science provided the scientists with the opportunity to develop new methods and techniques, changing thus the calculatingly intensive algorithms into feasible solutions. Simultaneously however, the easy with which we can assemble and store data in a digital way has created bulky and continuously growing databases. This fact can be observed in various sectors of society as the health, the trade, the economy, the telecommunications, but also in the most extraordinary regions of science as the astronomy and the pictures of astronomical bodies. It is not therefore strange the interest of the scientific community in finding techniques and methods for exporting information from these variform and enormous databases. The process of exploration and analysis of large databases is named Data Mining, DM. It constitutes a relatively new field of research - it was developed the past 30 years- which is found mainly in the section of three basic sciences: Statistics, Machine Learning and, Data Management and DataBases. It is a process that allocates a automated character, solves different problems from the ones that concern the classic statistics, covering the void of knowledge and facilitating the special researchers that are not experienced analysts. DM is an effort to resolve the problem that the information era brought, data overcollecting. It is applied in many sectors of human activity, such as fraud detection.Human activity sometimes aims at manipulation or deceive and Science tries to develop mechanisms that prevent or discover such type of behaviours. Fraud detection is a sector of science that has undertaken the responsibility of discovering fraud. The modern means have given the specialist with a lot of data and their effort of analysis is a case where DM can be applied.
Η πρόοδος της επιστήμης των υπολογιστών έδωσε την ευκαιρία στους επιστήμονες να αναπτύξουν νέες τεχνικές και μεθόδους μετατρέποντας έτσι τους υπολογιστικά έντονους αλγορίθμους σε εφικτές λύσεις. Ταυτόχρονα όμως, η ευκολία με την οποία μπορούμε να συγκεντρώσουμε και να αποθηκεύσουμε δεδομένα με ψηφιακό τρόπο δημιούργησε ογκώδη και συνεχώς αυξανόμενα σύνολα δεδομένων. Αυτό είναι ένα γεγονός που μπορεί να παρατηρήσει κανείς σε ποικίλους τομείς της κοινωνίας όπως την υγεία, το εμπόριο, την οικονομία, τις τηλεπικοινωνίες, αλλά και σε περισσότερο ασυνήθιστες περιοχές όπως την αστρονομία και τις εικόνες των αστρονομικών σωμάτων. Δεν είναι λοιπόν παράξενο το ενδιαφέρον της επιστημονικής κοινότητας προς την εύρεση τεχνικών και μεθόδων εξαγωγής πληροφορίας από αυτά τα ποικιλόμορφα και τεράστια σύνολα δεδομένων.Η διαδικασία της εξερεύνησης και ανάλυσης μεγάλων συνόλων από δεδομένα ονομάζεται Εξόρυξη Δεδομένων ή ΕΔ (Data Mining, DM). Αποτελεί ένα σχετικά καινούριο πεδίο έρευνας –αναπτύχθηκε τα τελευταία 30 χρόνια– που βρίσκεται κυρίως στην τομή τριών βασικών επιστημών: της Στατιστικής (Statistics), της Μηχανικής Εκμάθησης (Machine Learning) και της Διαχείρισης Δεδομένων και Βάσεων Δεδομένων (Data Management and DataBases). Πρόκειται για μια διαδικασία που διαθέτει ένα αυτοματοποιημένο χαρακτήρα, επιλύει διαφορετικά προβλήματα από τα συνήθη θέματα που αφορούν στην κλασική στατιστική συμπερασματολογία, καλύπτοντας το κενό της γνώσης και διευκολύνοντας τους ειδικούς ερευνητές που δεν είναι έμπειροι αναλυτές. Η ΕΔ είναι μια προσπάθεια επίλυσης του προβλήματος που έφερε η εποχή της πληροφορίας, την υπερσυλλογή δεδομένων. Εφαρμόζεται σε πάρα πολλούς τομείς της ανθρώπινης δραστηριότητας όπως η ανίχνευση απάτης.Η δραστηριότητα του ανθρώπου ορισμένες φορές έχει στόχο την παραπλάνηση ή εξαπάτηση και η επιστήμη προσπαθεί να αναπτύξει μηχανισμούς που εμποδίζουν ή ανακαλύπτουν τέτοιου είδους συμπεριφορές. Η ανίχνευση απάτης είναι ένας κλάδος της επιστήμης που έχει αναλάβει την ευθύνη της ανακάλυψης μιας απάτης. Τα σύγχρονα μέσα έχουν δώσει πολλά στοιχεία στους ειδικούς και η προσπάθεια ανάλυσης τους είναι μια περίπτωση που η ΕΔ βρίσκει εφαρμογή.

info:eu-repo/semantics/masterThesis
Postgraduate Thesis / Μεταπτυχιακή Εργασία

Στατιστική
Ανακάλυψη γνώσης σε βάσεις δεδομένων
Ανίχνευση απάτης
Knowledge discovery in databases
Data mining
Fraud detection
Statistics
Εξόρυξη δεδομένων

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

Greek
English

2008
2009-06-21T21:00:00Z


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Μαθηματικών

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/openAccess



*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)