Στην σημερινή εποχή είναι απαραίτητη η διαχείριση δεδομένων μεγάλης
διάστασης, γεγονός που απαιτεί την ανάπτυξη κατάλληλων μεθοδολογιών για
αυτόν τον σκοπό. Ο υπολογισμός διγραμμικών μορφών και συναφών ποσοτήτων
οδηγεί σε χρήσιμα συμπεράσματα και συχνά αποτελεί κριτήριο για ιδιότητες
που σχετίζονται με την εκάστοτε εφαρμογή. Σχεδόν σε όλες τις επιστημονικές
εφαρμογές όπως είναι η ανάλυση δικτύων, η πληροφορική, η στατιστική, η
οικονομία κ.α., η επεξεργασία των δεδομένων και η εξαγωγή συμπερασμάτων
απαιτεί τη διαχείριση πινάκων μεγάλης διάστασης. Στις εφαρμογές αυτές,
συνήθως δεν είναι εφικτός ο απευθείας υπολογισμός των επιθυμητών
διγραμμικών μορφών και έτσι απαιτείται η εκτίμησή τους. Στην παρούσα
διδακτορική διατριβή παράγουμε εκτιμήσεις για τις διγραμμικές μορφές του
τύπου xᵀf(A)y, όπου A ϵ Rᵖˣᵖ είναι ένας δοσμένος πίνακας, x, y ϵ Rᵖ και f
είναι μία ομαλή συνάρτηση ορισμένη στο φάσμα του πίνακα A. Η προτεινόμενη
μέθοδος βασίζεται σε μία μέθοδο παρεκβολής. Συγκεκριμένα, δημιουργούμε
εκτιμήσεις για τη διγραμμική μορφή xᵀA⁻¹y, όπου ο πίνακας Α είναι
αντιστρέψιμος. Αν τα διανύσματα x, y επιλεχθούν να είναι στήλες του
ταυτοτικού πίνακα, μπορούν να προκύψουν εκτιμήσεις για τα στοιχεία του
αντιστρόφου του δοσμένου πίνακα A. Επίσης, προσαρμόζουμε μερικές
αριθμητικές μεθόδους που βασίζονται στη μέθοδο της παρεκβολής και στην
αριθμητική ολοκλήρωση του Gauss για την εκτίμηση της διαγωνίου συναρτήσεων
συμμετρικών πινάκων, χωρίς να προσεγγίσουμε ολόκληρο τον πίνακα f(A).
Επιπροσθέτως, παράγουμε παραμετρικές οικογένειες διανυσματικών εκτιμήσεων
ενός, δύο και τριών όρων για τη δράση της συνάρτησης ενός διαγωνίσιμου
πίνακα σε ένα διάνυσμα, δηλαδή του γινομένου f(A)b. Ο υπολογισμός της
ποσότητας f(A)b, πηγάζει από την ύπαρξη εφαρμογών στις οποίες δεν είναι
απαραίτητο να εκτιμηθεί ολόκληρος ο πίνακας f(A) ή δεν είναι εφικτός ο
ακριβής υπολογισμός του πίνακα αυτού, ειδικά όταν ο A είναι μεγάλης
διάστασης. Ασχολούμαστε επίσης με την εκτίμηση και ελαχιστοποίηση της
γενικευμένης συνάρτησης διασταυρωμένης επικύρωσης (συνάρτηση GCV)
συνδυάζοντας τη μέθοδο της παρεκβολής και μία στατιστική προσέγγιση. Η
συνάρτηση GCV είναι ένα δημοφιλές εργαλείο για τον προσδιορισμό της
ρυθμιστικής παραμέτρου στο γραμμικό μοντέλο παλινδρόμησης ή ισοδύναμα της
παραμέτρου κανονικοποίησης στην κανονικοποίηση Tikhonov. Τέλος,
εφαρμόζουμε τις παραχθείσες εκτιμήσεις για τις προαναφερθείσες ποσότητες
σε προβλήματα που πηγάζουν από την ανάλυση δικτύων. Συγκεκριμένα, θα
αναγνωρίσουμε τους σημαντικότερους κόμβους ενός δικτύου και θα
εξακριβώσουμε την ευκολία μετάβασης ανάμεσα στους κόμβους. Χρησιμοποιούμε
τις εκτιμήσεις που έχουν προκύψει για τη συνάρτηση GCV στην επίλυση
διακριτών κακώς τοποθετημένων προβλημάτων καθώς και στην εκτίμηση των
συντελεστών του γραμμικού μοντέλου παλινδρόμησης που μελετάται στη
Στατιστική.
(EL)
The computation of bilinear forms is a mathematical problem with many applications. Specifically, they arise in network analysis in order to determine the importance of the nodes and the ease of travelling between the nodes of a graph.
They also arise naturally for the computation of parameters in some numerical methods for solving least squares and in Tikhonov regularization for solving ill-posed problems, etc.
Moreover, the action of a matrix function f(A) on a real vector of length p, i.e. the product f(A) b, often appears in applications which are originated from partial differential equations, in lattice quantum chromodynamics computations in chemistry and physics, in sampling from a Gaussian process distribution, and so forth.
If the matrix A is sufficiently large, the direct computation is not possible. Therefore, it is necessary to derive efficient estimates for these forms.
In the present PhD thesis, we derive estimates for the bilinear forms of the type xT f(A) y, where A is a given matrix with specific structure, x,y given vectors and f is a smooth function defined on the spectrum of the matrix A. The developed method based on an extrapolation procedure. Specifically, we generate estimates for the bilinear form xT A^{-1} y and vector estimates for the quantity f(A) b.
Furthermore, we adjust some numerical methods based on extrapolation and Gaussian quadrature rules for estimating the diagonal of matrix functions, without approximating the whole matrix f(A).
We are also concerned with the estimation and minimization of the generalized cross-validation (GCV) function by using a combination of an extrapolation procedure and a statistical approach.
Finally, we apply the generated estimates for the aforementioned quantities in problems which deal with network analysis, the solution of discrete ill-posed problems and the computation of the regression parameter of a statistical model.
(EN)