Οι ακτινογραφίες θώρακα αποτελούν ένα σημαντικό εργαλείο για τον εντοπισμό διαφόρων παθολογιών στο θώρακα. Οι αλγόριθμοι μηχανικής μάθησης που χρησιμοποιούνται για την κατηγοριοποίηση αυτών των ανωμαλιών χαρακτηρίζονται ως «μαύρα κουτιά» λόγω της αυξανόμενης πολυπλοκότητάς τους. Για την εφαρμογή αυτών των αλγορίθμων είναι απαραίτητη η χρήση και η ανάπτυξη μεθόδων ερμηνευσιμότητας (eXplainable Artificial Intelligence, XAI). Η παρούσα μελέτη χρησιμοποιεί το σύνολο δεδομένων VinBigData που περιλαμβάνει 18,000 οπισθο-πρόσθιας (PA) προβολής ακτινογραφίες θώρακα.
Στόχος αυτής της εργασίας είναι η ταξινόμηση και η δημιουργία χαρτών ερμηνείας έξι παθολογιών του θώρακα: ‘Aortic Enlargement’, ‘Cardiomegaly’, ‘Lung Opacity’, ‘Pleural Effusion’, ‘Pleural Thickening’, ‘Pulmonary Fibrosis’ και της κλάσης ‘No-Finding’ που αντιπροσωπεύει τις υγιείς ακτινογραφίες. Για την ταξινόμηση των ανωμαλιών χρησιμοποιείται ένα προ-εκπαιδευμένο ResNet50 μοντέλο στο σύνολο δεδομένων ImageNet και η μέθοδος ερμηνευσιμότητας είναι η Grad-Cam. Για την αξιολόγηση της Grad-Cam χρησιμοποιείται η μετρητική Intersection over Union (IoU) και η ανάλυση σημαντικότητας εικονοστοιχείων.
Το μοντέλο επιτυγχάνει ένα F1 score 0.81, με την κλάση ‘No-Finding’ να κατέχει την υψηλότερη τιμή. Οι κλάσεις ‘Aortic Enlargement’ και ‘Cardiomegaly’ παρουσιάζουν ικανοποιητικά αποτελέσματα, ενώ οι κλάσεις ‘Lung Opacity’ και ΄Pulmonary Fibrosis’ παρουσιάζουν τις χαμηλότερες τιμές. Από τους χάρτες ερμηνείας που προκύπτουν από την εφαρμογή της Grad-Cam, παρατηρείται η ικανότητα εντοπισμού των κλάσεων ‘Aortic Enlargement’ και ‘Cardiomegaly’, ενώ για τις υπόλοιπες κλάσεις παρουσιάζουν λιγότερα αξιόπιστα αποτελέσματα. Παρόλο, που αυτή η μελέτη καταλήγει σε ενθαρρυντικά αποτελέσματα, η ταξινόμηση των ακτινογραφιών θώρακα με μοντέλα βαθιάς μηχανικής μάθησης απαιτεί την περαιτέρω ανάπτυξη μεθόδων ερμηνευσιμότητας.
(EL)
Chest X-rays are a crucial tool for detecting abnormalities with the classification and localization of these diseases under intense research. The black box nature of deep learning algorithms necessitates the development of eXplainable Artificial Intelligence (XAI) methods. This study employs the VinBigData dataset, featuring 18,000 posterior-anterior (PA) images from Hospital 108 (H108) and Hanoi Medical University Hospital (HMUH) in Vietnam.
The focus of this study is on classifying six abnormalities (‘Aortic Enlargement’, ‘Cardiomegaly’, ‘Lung Opacity’, ‘Pleural Effusion’, ‘Pleural Thickening’ and ‘Pulmonary Fibrosis’) and a ‘No-Finding’ class which represents the absence of a disease. A pretrained ResNet50 on the ImageNet dataset is used, and Grad-Cam is the chosen XAI method. Evaluation of the XAI methods involves using the Intersection Over Union (IoU) metric to assess alignment between ground truth and predicted bounding boxes. Pixel importance analysis is also used for evaluation of the XAI method by replacing crucial pixels identified by Grad-Cam, with mean values in all three channels.
The model achieves a micro F1 score of 0.81, with ‘No-Finding’ obtaining the highest F1 score (0.96). ‘Aortic Enlargement’ and ‘Cardiomegaly’ show satisfactory F1 scores (0.86 and 0.83), while ‘Lung Opacity’ and ‘Pulmonary Fibrosis’ exhibit lower values (0.55 and 0.57). Examining Grad-Cam heatmaps reveals stable behaviour and localization for ‘Aortic Enlargement’ and ‘Cardiomegaly’. However, other classes produce less reliable heatmaps, with ‘Pleural Thickening’ showing the least favourable results.
While this research provides encouraging outcomes, chest X-rays classification remains challenging, necessitating further research of XAI methods and evaluation processes.
(EN)