Web query disambiguation using PageRank

RDF 

 
Το τεκμήριο παρέχεται από τον φορέα :
Πανεπιστήμιο Πατρών
Αποθετήριο :
Νημερτής
δείτε την καρτέλα τεκμηρίου
μέσα από τον ιστότοπο του αποθετηρίου του φορέα *
κοινοποιήστε το τεκμήριο



Σημασιολογικός εμπλουτισμός/ομογενοποίηση από το EKT

2011 (EL)
Web query disambiguation using PageRank

Μακρής, Χρήστος
Πλέγας, Γιάννης
Στάμου, Σοφία

Stamou, Sofia
Makris, Christos
Plegas, Yanis

The topic of the paper is the exploration of Word Sense Disambiguation strategies in the Web and their probable exploitation for query expansion in Web search engines. Our aim is at scalable techniques that can be applied without loss of efficiency to large datasets, as are these in the Web, and we propose heuristics that use the Web pages’ PageRank as an indicator of the significance of the sense a word carries during a query specified by a user.
Το θέμα της εργασίας είναι η διερεύνηση της απόδοσης στρατηγικών αποσαφήνισης στον παγκόσμιο ιστό, και η πιθανή αξιοποίησή τους για η επέκταση ερωτημάτων σε μηχανές αναζήτησης. Στόχος είναι κυρίως επεκτάσιμες τεχνικές που μπορούν να εφαρμοστούν χωρίς απώλεια απόδοσης σε μεγάλα μεγέθη κειμενικών δεδομένων, όπως αυτά στον Παγκόσμιο Ιστό, και προτείνονται ευρετικές τεχνικές που χρησιμοποιούν το PageRank των σελίδων στο Web, ως ένδειξη της σημασίας που έχει την έννοια μιας λέξης μεταφέρει κατά τη διάρκεια ενός ερωτήματος που καθορίζεται από τον χρήστη.
Ηράκλειτος ΙΙ – Ενίσχυση του ανθρώπινου ερευνητικού δυναμικού μέσω της υλοποίησης διδακτορικής έρευνας

Technical Report

Ανάκτηση πληροφορίας στον Παγκόσμιο Ιστό
Σημασιολογική αναζήτηση
Αποσαφήνιση έννοιας λέξεως
Semantic search
Επέκταση ερωτημάτων
Ανάλυση συνδέσμων
Query expansion
Word Sense Disambiguation
link analysis
Web searching

Πανεπιστήμιο Πατρών (EL)
University of Patras (EN)

2011-12-02T07:47:07Z
2011-12-02
2011-12-01




*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.