3Δ ανακατασκευή πραγματικού χρόνου με βελτιστοποιημένη εκτίμηση υποβάθρου σε δίκτυο πολλαπλών καμερών

 
This item is provided by the institution :

Repository :
E-Locus Institutional Repository
see the original item page
in the repository's web site and access all digital files if the item*
share




2011 (EN)

GPU-Powered Multi-Camera 3D Reconstruction Based on Optimized Foreground Detection
3Δ ανακατασκευή πραγματικού χρόνου με βελτιστοποιημένη εκτίμηση υποβάθρου σε δίκτυο πολλαπλών καμερών

Τζεβανίδης, Κωνσταντίνος Στέφανος

Αργυρός Αντώνης

Ο στόχος της εργασίας αυτής είναι η υψηλής ποιότητας 3Δ ανακατασκευή μιας σκηνής σε πραγματικό χρόνο βάση εικόνων που προσλαμβάνονται από ένα σύστημα πολλαπλών καμερών. Για να εξασφαλίσουμε την υψηλή ποιότητα της 3Δ ανακατασκευής, προτείνουμε έναν νέο αλγόριθμο που βελτιστοποιεί χωρίς επίβλεψη τις παραμέτρους εκτέλεσης της διαδικασίας εκτίμησης υποβάθρου λαμβάνοντας υπόψη πληροφορία για την δομή του δικτύου καμερών. Επίσης, για να επιτύχουμε την επιθυμητή υπολογιστική επίδοση προτείνουμε και υλοποιούμε μια πλήρη διαδικασία ανακατασκευής που εκτελείται σε επιταχυντές γραφικών (GPUs). Η διαδικασία ανακατασκευής δέχεται ως είσοδο έγχρωμες εικόνες και παράγει ως έξοδο λίστες τριγώνων με πληροφορία υφής. Αυτό έρχεται σε αντίθεση με παρεμφερείς προσεγγίσεις στις οποίες η είσοδος αποτελείται από δυαδικές εικόνες του προσκηνίου που τυπικά παράγονται στην κεντρική μονάδα επεξεργασίας του συστήματος, ενώ η έξοδος είναι κάποια ογκομετρική αναπαράσταση του οπτικού περιβλήματος της σκηνής. Μεταξύ των συνεισφορών της παρούσας εργασίας συγκαταλέγονται: (α) ένας νέος αλγόριθμος για την άνευ επίβλεψης εκμάθηση των βέλτιστων παραμέτρων εκτέλεσης της διαδικασίας ανίχνευσης του προσκήνιου σε δίκτυα πολλαπλών καμερών, (β) η υλοποίηση σε επιταχυντές γραφικών μιας πλήρους διαδικασίας 3Δ ανακατασκευής που περιλαμβάνει νέες παραλληλοποιήσεις δημοφιλών αλγορίθμων για εκτίμηση του προσκηνίου και της 3Δ ανακατασκευής του, μαζί με παράλληλες υλοποιήσεις κοινών αλγορίθμων γραφικής και (γ) ο σχεδιασμός και η υλοποίηση μιας επεκτάσιμης αρχιτεκτονικής δικτύου πολλών καμερών για 3Δ ανακατασκευή πραγματικού χρόνου καθώς και η χρήση της σε εφαρμογές υπολογιστικής όρασης υπό πραγματικές συνθήκες. Αποτελέσματα εκτεταμένων πειραμάτων επαληθεύουν την αποδοτικότητα της προτεινόμενης μεθόδου εκμάθησης παραμέτρων χωρίς επίβλεψη. Επιπλέον, η ανάλυση της απόδοσης του προτεινόμενου συστήματος δείχνει ότι μια ακριβής, υψηλής ποιότητας ανακατασκευή σκηνής που περιλαμβάνει πληροφορία υφής μπορεί να επιτευχθεί σε πραγματικό χρόνο χρησιμοποιώντας οχτώ κάμερες και έναν επιταχυντή γραφικών. Συγκρίσεις που έγιναν με τα πιο σύγχρονα σχετικά συστήματα ανακατασκευής δείχνουν ότι το προτεινόμενο σύστημα παρουσιάζει καλύτερες επιδόσεις στις περισσότερες των περιπτώσεων. Τέλος, η χρήση του συστήματος ανακατασκευής που περιγράφεται στην παρούσα εργασία σε εφαρμογές υπολογιστικής όρασης κάτω από πραγματικές συνθήκες (Αρχαιολογικό Μουσείο Θεσσαλονίκης, μόνιμη έκθεση "Μακεδονία: από τις ψηφίδες στα pixels"), μας παρέχει ισχυρές ενδείξεις σχετικά με την αποδοτικότητα, την αξιοπιστία και την υπολογιστική του απόδοση. (EL)
As digital cameras become cheaper, multi-camera systems or camera networks are becoming commonplace. Calibrated multi-view setups are associated with some strong assumptions and their intrinsic/extrinsic calibration is a tedious process. Nevertheless, their ability to reduce occlusion effects and appearance ambiguities lead to more robust computer vision algorithms, a fact that typically outweighs their disadvantages. A great number of computer vision applications employ such setups in order to acquire rich 3D information regarding the environment in which they operate. These applications typically have real-time performance requirements. Past approaches on real-time multi-view 3D reconstruction employed expensive special purpose hardware and/or powerful mainframes to achieve real-time performance at the required quality. The goal of this work is the high quality, real-time 3D reconstruction of a scene based on visual input provided by a multicamera system. To achieve high quality in reconstruction we propose a novel algorithm for optimizing the parameters of the underlying foreground segmentation process. Furthermore, to meet the real-time performance requirements, we propose and implement a complete GPU reconstruction pipeline whose input is colored multi-frames and output is textured 3D meshes. This is in contrast to existing shape-from-silhouette GPU-based approaches where the input is binary foreground images, typically processed by the host's CPU, and their output is a volumetric representation of the visual hull of the scene. The contributions of this thesis include (a) a novel algorithm for unsupervised learning of optimal foreground detection parameters in multi-camera systems, (b) the implementation for GPU execution of a complete 3D reconstruction pipeline that includes novel parallelizations of popular foreground segmentation and 3D reconstruction algorithms along with parallel implementations of common graphics algorithms, and (c) the design and realization of a scalable architecture implementing a physical multi-view 3D reconstruction system along with the deployment of it in real-world computer vision applications. Extensive experimental results con_rm the e_ectiveness of the adopted approach for learning the parameters of foreground detection. The performance analysis of the proposed multi-view system also demonstrates that an accurate, high resolution texturemapped 3D reconstruction of a scene observed by eight cameras is achievable in real-time with a single GPU. Comparisons against the state-of-the-art in GPU-powered 3D reconstruction on a standard dataset show that the proposed system outperforms most of the competition. Finally, the deployment of the proposed 3D reconstruction system in real-world applications (Archaeological Museum of Thessaloniki, permanent exhibition `Macedonia: from fragments to pixels' ) provides strong evidence on its robustness, effciency and effectiveness. (EN)

text
Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης

GPU Computing
3D Reconstruction
Playful Learning
Multi-Camera System
Ανίχνευση προσκηνίου
Multi-Camera Conse
Foreground Detection
3Δ ανακατασκευή
Επιταχυντές γραφικών
Δίκτυο καμερών


English

2011-07-15


Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης




*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)