Determination of minced meat quality using machine learning

 
δείτε την πρωτότυπη σελίδα τεκμηρίου
στον ιστότοπο του αποθετηρίου του φορέα για περισσότερες πληροφορίες και για να δείτε όλα τα ψηφιακά αρχεία του τεκμηρίου*
κοινοποιήστε το τεκμήριο




2017 (EL)

Εκτίμηση της ποιότητας του κρέατος με χρήση μεθόδων μηχανικής μάθησης
Determination of minced meat quality using machine learning

Ropodi, Athina I.
Ροπόδη, Αθηνά Ι.

Νυχάς, Γεώργιος- Ιωάννης
Nychas, George John

Currently, consumers expect constant reassurance of the origin, quality and compliance to label of the food products they purchase. Therefore, food industries, retailers and authorities have to develop advanced, effective and relatively low-cost solutions for quality assurance and detection of fraudulent practices. In this context, this study focuses on (a) Multispectral Imaging (MSI), (b) Fourier Transform Infrared (FTIR) spectrometry and (c) the application of advanced data analysis and machine learning methodologies. In terms of quality, the efficacy of the abovementioned methods concerning (a) non-compliance to label/ fraud detection and (b) microbiological spoilage is examined and the following analyses took place: In the first case, minced beef adulteration with pork was investigated. MSI data from 220 meat samples from four independent experiments (different meat batches) were extracted. Adulteration was performed with a 10% w/w step, creating 11 classes of samples (including pure beef and pork). After an image preprocessing step, Hierarchical Cluster Analysis (HCA) and Principal Component Analysis (PCA) were applied. Meat batches displayed significant differences and different classes were less distinguishable when the first three batches were included in the analysis. After partitioning in training and validation sets, the fourth batch was retained for independent/ external validation and Linear Discriminant Analysis (LDA) and Partial Least Squares Discriminant Analysis (PLSDA) were performed for classification among 11 classes and pure vs. adulterated samples. For the case of 11 classes, 98.48% and 96.97% of the samples were classified within a ±10% category of adulteration for LDA and PLSDA respectively, whereas the 3-class case yielded 98.48% overall correct classification (OCC). Results for the external validation set, proved LDA significantly less accurate compared to PLSDA where all samples were classified correctly, proving that 10% is within the method’s detection limit. In the second case, with 110 samples from three different batches of minced beef and horsemeat and additional images captured after 6, 24 and 48 h, model performance is investigated in terms of detection of adulteration. PCA was used for visualization purposes, while PLSDA and Random Forest (RF) for classification among different percentages of beef (4 classes), pure beef vs. pure horsemeat vs. adulterated samples, pure beef and horse vs. adulterated samples and freshly-ground vs. stored minced meat. Models significantly underperformed in independent validation. In the end, a two stage Support Vector Machine (SVM) methodology was utilized, where freshly-ground samples are separated from stored and then pure separated from adulterated. The OOC of the SVM model was equal to 95.31% for independent model validation. In the third case, multispectral images and FTIR spectra from seven different batches of freshly-ground beef, along with MSI and FTIR spectral data after being frozen (-20°C) for 7 and 32 days and then thawed were acquired (in total, 105 measurements per sensor). In terms of data analysis methods, PCA was used for data exploration, while PLSDA and SVM yielded 100% correct classification between fresh and frozen-then-thawed samples for MSI test and external validation sets. FTIR proved less accurate, as PLSDA yielded 93.3 and 96.7% classification accuracy for the test and external validation set, respectively. In cases 4 and 5, meat and specifically minced beef spoilage is explored. In case 4, using “MeatReg”, a web-based application, seven methods were tested for the prediction of bacterial counts. The dataset included 105 samples, stored in air or under modified air packaging (MAP) conditions (20% CO2/ 80% O2) at 4 and 10°C, microbiologically analyzed (Pseudomonads, Lactobacilli, B. thermosphacta and Enterobacteriaceae, as well as TVC). FTIR and MSI data were compared with electronic nose, High Performance Liquid Chromatography and Gas Chromatography coupled to Mass Spectrometry data. Results were mixed depending on the sensor and species counts, while RF regression yielded an overall good performance. Similarly to case 4, in case 5, 168 minced beef samples were analyzed for TVC, while FTIR measurements took place. Samples were stored in air or under modified air packaging (MAP) conditions at 4 and 10°C. An ensemble-based approach was employed where spoilage estimation was a fusion of several artificial neural networks yielding a mean squared error equal to 0.16 (log CFU/g)^2.
Τη σημερινή εποχή, οι καταναλωτές απαιτούν συνεχή επιβεβαίωση της προέλευσης, της ποιότητας και της συμμόρφωσης με την ετικέτα των τροφίμων που αγοράζουν. Για το λόγο αυτό, οι βιομηχανίες τροφίμων, οι έμποροι και οι αρχές είναι αναγκαίο να αναπτύξουν προηγμένες, αποτελεσματικές και χαμηλού κόστους λύσεις για τη διασφάλιση της ποιότητας και τον εντοπισμό δόλιων πρακτικών. Σε αυτό το πλαίσιο, η μελέτη αυτή εστιάζει (α) στην πολυφασματική απεικόνιση (Multispectral Imaging-MSI), (β) την φασματοσκοπία υπέρυθρου με μετασχηματισμό Fourier (Fourier Transform Infrared -FTIR spectrometry) και (γ) την εφαρμογή προηγμένων μεθόδων ανάλυσης δεδομένων και μηχανικής μάθησης. Όσον αφορά την ποιότητα, εξετάστηκε η αποτελεσματικότητα των προαναφερόμενων μεθόδων σε σχέση με (α) τον εντοπισμό της μη-συμμόρφωσης με την ετικέτα ή/και δόλιων πρακτικών και (β) τη μικροβιολογική αλλοίωση. Οι ακόλουθες αναλύσεις, έλαβαν χώρα: Στην 1η περίπτωση, εξετάστηκε η νοθεία του μοσχαρίσιου κιμά με χοιρινό. Χρησιμοποιήθηκαν 220 πολυφασματικές εικόνες δειγμάτων από 4 ανεξάρτητες πειραματικές διαδικασίες (κομμάτια κρέατος διαφορετικής προέλευσης). Η νοθεία έγινε με βήμα 10% w/w, δημιουργώντας 11 κατηγορίες (συμπεριλαμβανομένων των ανόθευτων χοιρινών και μοσχαρίσιων δειγμάτων). Μετά από ένα στάδιο προεπεξεργασίας της εικόνας, εφαρμόστηκαν η Ιεραρχική Ανάλυση Συστάδων (Hierarchical Cluster Analysis - HCA) και Ανάλυση Κυρίων Συνιστωσών (Principal Component Analysis - PCA). Παρατηρήθηκαν δε σημαντικές διαφορές μεταξύ των διαφορετικών κομματιών κρέατος και των διαφορετικών κλάσεων όταν και τα τρία πρώτα ζευγάρια κομματιών κρέατος συμπεριλήφθηκαν στην ανάλυση. Μετά την κατάτμηση των δεδομένων σε σετ εκπαίδευσης και επικύρωσης, τα δεδομένα του τέταρτου ζεύγους χρησιμοποιήθηκαν για ανεξάρτητη επικύρωση και εφαρμόστηκαν οι μέθοδοι Γραμμικής Διακριτικής Ανάλυσης και Μερικών Ελαχίστων Τετραγώνων Linear Discriminant Analysis - LDA, Partial least-squares discriminant analysis – PLSDA) για 11 και για 3 (ανόθευτα χοιρινά, μοσχαρίσια και νοθευμένα) κλάσεις. Στην περίπτωση των 11 κλάσεων, 98.48% και 96.97% των δειγμάτων κατηγοριοποιήθηκαν εντός μιας ±10% κατηγορίας για LDA και PLSDA αντίστοιχα, ενώ στην περίπτωση των τριών επιτεύχθηκε σωστή κατηγοριοποίηση 98.48%. Τα αποτελέσματα της ανεξάρτητης επικύρωσης ήταν λιγότερο ακριβή για την LDA, αλλά με την PLSDA όλα τα δείγματα κατηγοριοποιήθηκαν σωστά, αποδεικνύοντας ότι το ποσοστό 10% είναι εντός των ορίων ανίχνευσης. Στην δεύτερη περίπτωση, 110 δείγματα κιμά τριών διαφορετικών κομματιών κρέατος από μοσχάρι και άλογο και επιπλέον εικόνες που ελήφθησαν μετά από 6, 24 και 48 ώρες χρησιμοποιήθηκαν για την ανίχνευση νοθείας. Η PCA χρησιμοποιήθηκε για οπτικοποίηση των δεδομένων, ενώ οι μέθοδοι PLSDA και Random Forest (RF) για κατηγοριοποίηση μεταξύ διαφορετικών ποσοστών νοθείας (4 κλάσεις), ανόθευτων μοσχαρίσιων, ανόθευτων αλογίσιων και νοθευμένων, ανόθευτων και νοθευμένων, και τέλος μεταξύ φρέσκων και συντηρημένων δειγμάτων. Τα μοντέλα κατά την ανεξάρτητη επικύρωση δεν είχαν υψηλή ακρίβεια. Στο τέλος, προτιμήθηκε η χρήση μηχανών διανυσμάτων υποστήριξης (Support Vector Machines – SVMs) σε δύο στάδια προκειμένου να διαχωριστούν τα φρέσκα από τα συντηρημένα δείγματα και μετά τα νοθευμένα από τα ανόθευτα. Έτσι, επιτεύχθηκε ποσοστό σωστής κατηγοριοποίησης 95.31% στο ανεξάρτητο σετ επικύρωσης. Στην τρίτη περίπτωση, ελήφθησαν πολυφασματικές εικόνες και φάσματα FTIR από κιμά επτά διαφορετικών κομματιών και από αντίστοιχα αποψυγμένα δείγματα που είχαν καταψυχθεί στους -20°C για 7 και 32 μέρες (συνολικά 105 εικόνες και φάσματα). Η PCA χρησιμοποιήθηκε για τη διερεύνηση των δεδομένων, ενώ PLSDA και SVM πέτυχαν 100% σωστή κατηγοριοποίηση μεταξύ φρέσκων και αποψυγμένων κατά την επικύρωση και την ανεξάρτητη επικύρωση με χρήση πολυφασματικών εικόνων. Η FTIR ήταν λιγότερο ακριβής με 93.3 και 96.7% αντίστοιχα. Στην 4η και 5η περίπτωση, διερευνήθηκε η αλλοίωση του βοδινού κιμά. Στην 4η περίπτωση, χρησιμοποιώντας τη διαδικτυακή εφαρμογή “MeatReg”, χρησιμοποιήθηκαν επτά διαφορετικές μέθοδοι για την εκτίμηση του μικροβιακού πληθυσμού. Τα δεδομένα αποτελούνταν από 105 δείγματα συντηρημένα σε δυο διαφορετικές συσκευασίες -αέρας και modified air packaging (MAP - 20% CO2/ 80% O2)- και δύο θερμοκρασίες (4 και 10°C), μικροβιολογικές αναλύσεις (Pseudomonads, Lactobacilli, B. thermosphacta and Enterobacteriaceae, Ολική Μεσόφιλη Χλωρίδα - ΟΜΧ). Τα δεδομένα πολυφασματικής απεικόνισης και FTIR συγκρίθηκαν με αυτά από ηλεκτρονική μύτη, υγρή χρωματογραφία υψηλής απόδοσης (HPLC) και αέρια χρωματογραφία/ φασματοσκοπία μάζας (GC-MS). Τα αποτελέσματα διαφοροποιήθηκαν αρκετά ανάλογα το είδος του οργάνου και της ομάδας μικροοργανισμών. Παρόλα αυτά υπήρξε καλή ακρίβεια, με την μέθοδο RF να δίνει τα καλύτερα αποτελέσματα. Ομοίως στην 5η περίπτωση, 168 δείγματα βοδινού κιμά αναλύθηκαν ως προς την ΟΜΧ, ενώ παράλληλα έγιναν μετρήσεις FTIR. Τα δείγματα είχαν συντηρηθεί σε αέρα και MAP στους 4 και 10°C. Χρησιμοποιήθηκε μία προσέγγιση βασισμένη στην μεθοδολογία των ensemble μοντέλων, όπου η εκτίμηση της αλλοίωσης έγινε βάσει μίας μίξης αποτελεσμάτων επιμέρους νευρωνικών δικτύων (artificial neural networks). Το μέσο τετραγωνικό σφάλμα της πρόβλεψης ήταν 0.16 (log CFU/g)^2.

Διδακτορική εργασία

Spectroscopy
Data analysis
Multispectral imaging
Ανάλυση δεδομένων
Πολυφασματική απεικόνιση
Φασματοσκοπία
Mετασχηματισμόw Fourier
FTIR
Μηχανική μάθηση
Machine learning
Ποιότητα κρέατος
Fourier transform infrared
Meat quality


Αγγλική γλώσσα

2017-10-17





*Η εύρυθμη και αδιάλειπτη λειτουργία των διαδικτυακών διευθύνσεων των συλλογών (ψηφιακό αρχείο, καρτέλα τεκμηρίου στο αποθετήριο) είναι αποκλειστική ευθύνη των αντίστοιχων Φορέων περιεχομένου.