S-Index Implementation and Performance for Textbases
Nitsos, Ilias
Dervos, Dimitrios
Evangelidis, Georgios
Δημοσιεύσεις μελών--ΣΔΟ--Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης, 2001
In this paper is presented the implementation of an improved, compressed variation of S-Index and studied its imputation in indexing a free text database. S-Index, where 'S' stands for signature and 'I' for inverted file, is a hybrid indexing form that combines the merits from two popular indexing methods: the inverted file and the signature file, or bitmap. There is also presented the structure of the method used, as well as the details of materialising the compressed variation of S-Index. The results of the research are compared to the ones from the compressed variation of indexing inverted files. With a little effort in adjusting its parameters, S-Index occupies less that 5% from the database that is indexed. This result is comparable to the inverted file's attribution.
Στην εργασία αυτή παρουσιάζουμε την υλοποίηση μιας βελτιωμένης, συμπιεσμένης παραλλαγής του S-Index και μελετούμε την απόδοσή της στην ευρετηριοποίηση μιας βάσης ελεύθερου κειμένου. Η S-Index, όπου το ‘S’ σημαίνει signature (υπογραφή) και το ‘Ι’ inverted file (ανεστραμμένο αρχείο), είναι ένα υβριδικό σχήμα ευρετηριοποίησης που συνδυάζει προτερήματα από δυο δημοφιλείς μεθόδους ευρετηριοποίησης: το ανεστραμμένο αρχείο και το αρχείο υπογραφών ή bitmap. Παρουσιάζουμε τη δομή της μεθόδου καθώς και λεπτομέρειες της υλοποίησης της συμπιεσμένης παραλλαγής της S-Index. Τα αποτελέσματα μας συγκρίνονται με αυτά της συμπιεσμένης παραλλαγής του ευρετηρίου ανεστραμμένου αρχείου. Με ελάχιστη προσπάθεια όσον αφορά στη ρύθμιση των παραμέτρων της, η S-Index καταλαμβάνει λιγότερο από το 5% της προς ευρετηριοποίηση βάσης κειμένου. Το αποτέλεσμα αυτό είναι συγκρίσιμο με την απόδοση του ανεστραμμένου αρχείου.
8th Panhellenic Conference on Informatics with international participation
English
2001-11
Nitsos, I., Dervos, D., Evangelidis, G. (2001). S-Index Implementation and Performance for Textbases. Πρακτικά συνεδρίου από 8ο Panhellenic Conference on Informatics with international participation που διεξήχθη σε Nicosia, Cyprus.