Focal modulation based end-to-end multi-label classification for chest X-ray image classification
Date
Authors
Editor(s)
Advisor
Supervisor
Co-Advisor
Co-Supervisor
Instructor
BUIR Usage Stats
views
downloads
Citation Stats
Series
Abstract
Chest X-ray imaging is of critical importance in order to effectively diagnose chest diseases, which are increasing today due to various environmental and hereditary factors. Although chest X-ray is the most commonly used device for detecting pathological abnormalities, it can be quite challenging for specialists due to misleading locations and sizes of pathological abnormalities, visual similarities, and complex backgrounds. Traditional deep learning (DL) architectures fall short due to relatively small areas of pathological abnormalities and similarities between diseased and healthy areas. In addition, DL structures with standard classification approaches are not ideal for dealing with problems involving multiple diseases. In order to overcome the aforementioned problems, firstly, background-independent feature maps were created using a conventional convolutional neural network (CNN). Then, the relationships between objects in the feature maps are made suitable for multi-label classification tasks using the focal modulation network (FMA), an innovative attention module that is more effective than the self-attention approach. Experiments using a Chest x-ray dataset containing both single and multiple labels for a total of 14 different diseases show that the proposed approach can provide superior performance for multi-label datasets.
Çeşitli çevresel ve kalıtsal faktörlerin etkisiyle günümüzde artan göğüs hastalıklarının erken dönemde etkili biçimde teşhis edilebilmesi amacıyla göğüs röntgeni görüntüleri kritik öneme sahiptir. Göğüs röntgeni patolojik anormalliklerin tespitinde en sık kullanılan cihaz olmasına rağmen patolojik anormalliklerin değişken lokasyonları ve boyutları, görsel benzerlikler ve karmaşık arka plan gibi yanıltıcılar sebebiyle uzmanlar için oldukça zorlayıcı olabilmektedir. Geleneksel derin öğrenme (DÖ) mimarileri patolojik anormalliklerin nispeten küçük alanlarda olması ve hastalıklı-sağlıklı alanların benzerliklerinden ötürü yetersiz kalmaktadır. Ek olarak, standart sınıflandırma yaklaşımlarına sahip DÖ yapıları çoklu hastalık içeren problemler ile baş etmek için ideal değildirler. Bahsedilen problemlerin üstesinden gelebilmek için bu çalışmada ilk olarak bilindik bir konvolüsyonel sinir ağı (KSA) kullanılarak arka plandan bağımsız özellik haritaları oluşturulmuştur. Daha sonra, özellik haritalarındaki nesneler arasındaki ilişkiler öz-dikkat yaklaşımına göre daha efektif bir yenilikçi dikkat modülü olan fokal modülasyon ağı (FMA) kullanılarak çok etiketli sınıflandırma görevleri için uygun hale getirilmektedir. Toplamda 14 farklı hastalığa dair hem tekli ve hem de çoklu etiketler içeren bir göğüs röntgeni veri kümesi kullanılarak gerçekleştirilen deneyler önerilen yaklaşımın çok etiketli veri kümeleri için üstün performans saglayabileceğini göstermektedir.