3Δ ανακατασκευή πραγματικού χρόνου με βελτιστοποιημένη εκτίμηση υποβάθρου σε δίκτυο πολλαπλών καμερών

3Δ ανακατασκευή πραγματικού χρόνου με βελτιστοποιημένη εκτίμηση υποβάθρου σε δίκτυο πολλαπλών καμερών

URI: https://www.openarchives.gr/aggregator-openarchives/edm/elocus/000018-dlib_3_6_b_metadata-dlib-46a738d5f895c598bb6be97397f1e97b_1306316540.tkl
RDF/XML JSON-LD

This item is provided by the institution :

University of Crete

Repository :
E-Locus Institutional Repository

see the original item page
in the repository's web site and access all digital files if the item^*

Semantic enrichment by EKT

ΕΚΤ item type

Master thesis (EN)

EKT year

2011 (EN)

EKT historical period

Title

GPU-Powered Multi-Camera 3D Reconstruction Based on Optimized Foreground Detection

3Δ ανακατασκευή πραγματικού χρόνου με βελτιστοποιημένη εκτίμηση υποβάθρου σε δίκτυο πολλαπλών καμερών

Creator

Τζεβανίδης, Κωνσταντίνος Στέφανος

Contributor

Αργυρός Αντώνης

Description

Ο στόχος της εργασίας αυτής είναι η υψηλής ποιότητας 3Δ ανακατασκευή μιας σκηνής σε πραγματικό χρόνο βάση εικόνων που προσλαμβάνονται από ένα σύστημα πολλαπλών καμερών. Για να εξασφαλίσουμε την υψηλή ποιότητα της 3Δ ανακατασκευής, προτείνουμε έναν νέο αλγόριθμο που βελτιστοποιεί χωρίς επίβλεψη τις παραμέτρους εκτέλεσης της διαδικασίας εκτίμησης υποβάθρου λαμβάνοντας υπόψη πληροφορία για την δομή του δικτύου καμερών. Επίσης, για να επιτύχουμε την επιθυμητή υπολογιστική επίδοση προτείνουμε και υλοποιούμε μια πλήρη διαδικασία ανακατασκευής που εκτελείται σε επιταχυντές γραφικών (GPUs). Η διαδικασία ανακατασκευής δέχεται ως είσοδο έγχρωμες εικόνες και παράγει ως έξοδο λίστες τριγώνων με πληροφορία υφής. Αυτό έρχεται σε αντίθεση με παρεμφερείς προσεγγίσεις στις οποίες η είσοδος αποτελείται από δυαδικές εικόνες του προσκηνίου που τυπικά παράγονται στην κεντρική μονάδα επεξεργασίας του συστήματος, ενώ η έξοδος είναι κάποια ογκομετρική αναπαράσταση του οπτικού περιβλήματος της σκηνής. Μεταξύ των συνεισφορών της παρούσας εργασίας συγκαταλέγονται: (α) ένας νέος αλγόριθμος για την άνευ επίβλεψης εκμάθηση των βέλτιστων παραμέτρων εκτέλεσης της διαδικασίας ανίχνευσης του προσκήνιου σε δίκτυα πολλαπλών καμερών, (β) η υλοποίηση σε επιταχυντές γραφικών μιας πλήρους διαδικασίας 3Δ ανακατασκευής που περιλαμβάνει νέες παραλληλοποιήσεις δημοφιλών αλγορίθμων για εκτίμηση του προσκηνίου και της 3Δ ανακατασκευής του, μαζί με παράλληλες υλοποιήσεις κοινών αλγορίθμων γραφικής και (γ) ο σχεδιασμός και η υλοποίηση μιας επεκτάσιμης αρχιτεκτονικής δικτύου πολλών καμερών για 3Δ ανακατασκευή πραγματικού χρόνου καθώς και η χρήση της σε εφαρμογές υπολογιστικής όρασης υπό πραγματικές συνθήκες. Αποτελέσματα εκτεταμένων πειραμάτων επαληθεύουν την αποδοτικότητα της προτεινόμενης μεθόδου εκμάθησης παραμέτρων χωρίς επίβλεψη. Επιπλέον, η ανάλυση της απόδοσης του προτεινόμενου συστήματος δείχνει ότι μια ακριβής, υψηλής ποιότητας ανακατασκευή σκηνής που περιλαμβάνει πληροφορία υφής μπορεί να επιτευχθεί σε πραγματικό χρόνο χρησιμοποιώντας οχτώ κάμερες και έναν επιταχυντή γραφικών. Συγκρίσεις που έγιναν με τα πιο σύγχρονα σχετικά συστήματα ανακατασκευής δείχνουν ότι το προτεινόμενο σύστημα παρουσιάζει καλύτερες επιδόσεις στις περισσότερες των περιπτώσεων. Τέλος, η χρήση του συστήματος ανακατασκευής που περιγράφεται στην παρούσα εργασία σε εφαρμογές υπολογιστικής όρασης κάτω από πραγματικές συνθήκες (Αρχαιολογικό Μουσείο Θεσσαλονίκης, μόνιμη έκθεση "Μακεδονία: από τις ψηφίδες στα pixels"), μας παρέχει ισχυρές ενδείξεις σχετικά με την αποδοτικότητα, την αξιοπιστία και την υπολογιστική του απόδοση. (EL)

As digital cameras become cheaper, multi-camera systems or camera networks are becoming commonplace. Calibrated multi-view setups are associated with some strong assumptions and their intrinsic/extrinsic calibration is a tedious process. Nevertheless, their ability to reduce occlusion effects and appearance ambiguities lead to more robust computer vision algorithms, a fact that typically outweighs their disadvantages. A great number of computer vision applications employ such setups in order to acquire rich 3D information regarding the environment in which they operate. These applications typically have real-time performance requirements. Past approaches on real-time multi-view 3D reconstruction employed expensive special purpose hardware and/or powerful mainframes to achieve real-time performance at the required quality. The goal of this work is the high quality, real-time 3D reconstruction of a scene based on visual input provided by a multicamera system. To achieve high quality in reconstruction we propose a novel algorithm for optimizing the parameters of the underlying foreground segmentation process. Furthermore, to meet the real-time performance requirements, we propose and implement a complete GPU reconstruction pipeline whose input is colored multi-frames and output is textured 3D meshes. This is in contrast to existing shape-from-silhouette GPU-based approaches where the input is binary foreground images, typically processed by the host's CPU, and their output is a volumetric representation of the visual hull of the scene. The contributions of this thesis include (a) a novel algorithm for unsupervised learning of optimal foreground detection parameters in multi-camera systems, (b) the implementation for GPU execution of a complete 3D reconstruction pipeline that includes novel parallelizations of popular foreground segmentation and 3D reconstruction algorithms along with parallel implementations of common graphics algorithms, and (c) the design and realization of a scalable architecture implementing a physical multi-view 3D reconstruction system along with the deployment of it in real-world computer vision applications. Extensive experimental results con_rm the e_ectiveness of the adopted approach for learning the parameters of foreground detection. The performance analysis of the proposed multi-view system also demonstrates that an accurate, high resolution texturemapped 3D reconstruction of a scene observed by eight cameras is achievable in real-time with a single GPU. Comparisons against the state-of-the-art in GPU-powered 3D reconstruction on a standard dataset show that the proposed system outperforms most of the competition. Finally, the deployment of the proposed 3D reconstruction system in real-world applications (Archaeological Museum of Thessaloniki, permanent exhibition `Macedonia: from fragments to pixels' ) provides strong evidence on its robustness, effciency and effectiveness. (EN)

Type

text

Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης

Subject

GPU Computing

3D Reconstruction

Playful Learning

Multi-Camera System

Ανίχνευση προσκηνίου

Multi-Camera Conse

Foreground Detection

3Δ ανακατασκευή

Επιταχυντές γραφικών

Δίκτυο καμερών

Provider

University of Crete

Repository / collection

E-Locus Institutional Repository

Subcollections

Elocus

Language

English

Date

2011-07-15

Identifier

000366380

http://elocus.lib.uoc.gr:443/dlib/3/6/b/metadata-dlib-46a738d5f895c598bb6be97397f1e97b_1306316540.tkl

Source

Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης

*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)

3Δ ανακατασκευή πραγματικού χρόνου με βελτιστοποιημένη εκτίμηση υποβάθρου σε δίκτυο πολλαπλών καμερών

Βοηθείστε μας να κάνουμε καλύτερο το OpenArchives.gr.