Αυτόματη αναζήτηση τιμών προϊόντων στο διαδίκτυο με τεχνικές Web Scraping: ανάλυση περίπτωσης: τιμές κρασιών
(EL)
Μερτίκα, Αικατερίνη
aegean
Ο σκοπός της διπλωματικής εργασίας είναι η ανάπτυξη κατάλληλου λογισμικού, το οποίο θα αναζητά τιμές και άλλα χαρακτηριστικά προϊόντων στο διαδίκτυο τα οποία προορίζονται για στατιστική ανάλυση.
Η μεθοδολογία που θα χρησιμοποιηθεί θα είναι τεχνικές Web scraping. Το πρόγραμμα θα γραφτεί σε γλώσσα php και τα στοιχεία θα αποθηκεύονται σε MySQL database. Στη συνέχεια θα ακολουθεί κωδικοποίηση των δεδομένων και καθάρισμα της βάσης. Τέλος, τα δεδομένα θα είναι προσβάσιμα για εξαγωγή και στατιστική επεξεργασία σε οποιοδήποτε στατιστικό πρόγραμμα, excel, spss, stata.
Η συγκεκριμένη μελέτη περίπτωσης θα αναζητά κρασιά και διάφορα χαρακτηριστικά τους όπως χρώμα, ποικιλία, χώρα προέλευσης και τιμή κρασιών σε διαδικτυακά καταστήματα λιανικής πώλησης. Η αναζήτηση θα μπορεί να γίνεται σε τακτά χρονικά διαστήματα, σε συγκεκριμένες ημέρες και ώρες της εβδομάδας.