YOLODrone+: improved YOLO architecture for object detection in UAV images
Date
Authors
Editor(s)
Advisor
Supervisor
Co-Advisor
Co-Supervisor
Instructor
BUIR Usage Stats
views
downloads
Citation Stats
Series
Abstract
The performance of object detection algorithms running on images taken from Unmanned Aerial Vehicles (UAVs) remains limited when compared to the object detection algorithms running on ground taken images. Due to its various features, YOLO based models, as a part of one-stage object detectors, are preferred in many UAV based applications. In this paper, we are proposing novel architectural improvements to the YO-LOv5 architecture. Our improvements include: (i) increasing the number of detection layers and (ii) use of transformers in the model. In order to train and test the performance of our proposed model, we used VisDrone and SkyData datasets in our paper. Our test results suggest that our proposed solutions can improve the detection accuracy.
İnsansız Hava Araçları (İHA) üzerindeki kameralardan alınan görüntülerde, nesne tanıma algoritmalarının başarımı, yerden çekilen görüntülerdeki performanslara göre daha sınırlı kalabilmektedir. Birçok İHA uygulamasında, tekgeçişli olmasından ve iki-geçişli yöntemlere göre daha hızlı olmasından dolayı, önceden eğitilmiş modelleri ile beraber gelen YOLOv5 algoritması kullanılmaya başlanmıştır. Ancak YOLOv5 algoritmasının İHA tabanlı imgeler üzerindeki performansı, yerden çekilen resimler üzerindeki performansına oranla düşük kalmaktadır. O nedenle bu çalışmada, YOLOv5 algoritmasının performansını arttırmak adına mimari çözümler önerilmiştir. Bu çözümler: (i) farklı sayıda tahmin yapan katman kullanmak, ve (ii) dönüştürücü (transformer) katmanı kullanmak olarak sıralanabilir. Sunulan yöntem, en güncel olan VisDrone ve Sky- DataV1 veri kümeleri üzerinde, orijinal YOLOv5 algoritması ile karşılaştırıldığında, performans artışı sağlamıştır.