Κατηγοριοποίηση / Ταξινόμηση δεδομένων επιχειρήσεων με τεχνικές Εξόρυξης Δεδομένων

 
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2009 (EL)
Economical data classification using datamining
Κατηγοριοποίηση / Ταξινόμηση δεδομένων επιχειρήσεων με τεχνικές Εξόρυξης Δεδομένων

Γούδας, Θεοδόσιος Ευαγγέλου

παραπάνω ταξινομητών. Ελέγχουμε ποιοι ταξινομητές έχουν μεγαλύτερη ακρίβεια πρόβλεψης και κάτω υπό ποιες προϋποθέσεις (με ή χωρίς μέθοδο επιλογής χαρακτηριστικών - feature selection). Εν τέλει αποδεικνύουμε ότι είναι δυνατή η κατασκευή πληροφοριακού συστήματος – εφαρμογής η οποία θα είναι ικανή να προβλέπει ποιες οικονομικές εκθέσεις είναι πιστοποιημένες και ποιες όχι κυρίως με χρήση Support Vector Machines και του αλγορίθμου Back Propagation (οι οποίοι αποδείχθηκαν πιο αποτελεσματικοί).
Στόχος της παρούσας διπλωματικής εργασίας είναι να αξιολογηθούν οι ταξινομητές k – Πλησιέστερων γειτόνων, Νευρωνικών Δικτύων κανόνος Levenberg–Marquardt, Τυχαίων Νευρωνικών Δικτύων, Back Propagation, Naïve Bayes,Support Vector Machines και Δέντρων Απόφασης σύμφωνα με την ικανότητά τους να προβλέψουν τις πιστοποιημένες και μη πιστοποιημένες εκθέσεις των ορκωτών λογιστών (auditors) σε ένα δείγμα οικονομικών στοιχείων από 450 εταιρείες του Ηνωμένου Βασιλείου και της Ιρλανδίας. Η παραπάνω ταξινόμηση υλοποιήθηκε με MatLab με χρήση των υπορουτίνων PRTools. Στη συνέχεια εφαρμόζουμε τρεις μεθόδους επιλογής χαρακτηριστικών και συγκρίνουμε ξανά τα αποτελέσματα των
The primary objective of this master degree thesis is to examine the possibility to forecast if the grand accountants’ report (auditors) is qualified or not by using k – Nearest Neighbors, Levenberg – Marquardt Neural Networks, Random Neural Networks, Back Propagation, Naïve Bayes,Support Vector Machines and Decision Trees Classifiers. The above classification was implemented using MatLab in addition to PRTools subrootines on a 450 reports sample from different companies of UK and Ireland. Following, we apply three feature selection methods and we compare again the test results of the above classifiers. We evaluate which of them have the greatest forecasting ability and under which circumstances (with or without feature selection). Finally it is proved that the creation of an information system / application which can evaluate if a report it is qualified or not using Support Vector Machines and back propagation classifiers, it is possible.

info:eu-repo/semantics/masterThesis
Postgraduate Thesis / Μεταπτυχιακή Εργασία

Ταξινόμηση
Classification
Ορκωτοί λογιστές
Reports
Datamining
Classifier
Κατηγοριοποίηση
Auditors
Οικονομικά κείμενα
Εξόρυξη δεδομένων
Matlab

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (EL)
Aristotle University of Thessaloniki (EN)

2009
2009-11-12T08:54:41Z


Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής

This record is part of 'IKEE', the Institutional Repository of Aristotle University of Thessaloniki's Library and Information Centre found at http://ikee.lib.auth.gr. Unless otherwise stated above, the record metadata were created by and belong to Aristotle University of Thessaloniki Library, Greece and are made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). Unless otherwise stated in the record, the content and copyright of files and fulltext documents belong to their respective authors. Out-of-copyright content that was digitized, converted, processed, modified, etc by AUTh Library, is made available to the public under Creative Commons Attribution-ShareAlike 4.0 International license (http://creativecommons.org/licenses/by-sa/4.0). You are kindly requested to make a reference to AUTh Library and the URL of the record containing the resource whenever you make use of this material.
info:eu-repo/semantics/openAccess



*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.