YOLODrone+: improved YOLO architecture for object detection in UAV images

Date

2022-08-29

Editor(s)

Advisor

Supervisor

Co-Advisor

Co-Supervisor

Instructor

Source Title

Signal Processing and Communications Applications Conference (SIU)

Print ISSN

2165-0608

Electronic ISSN

Publisher

IEEE

Volume

Issue

Pages

[1] - [4]

Language

Turkish

Journal Title

Journal ISSN

Volume Title

Series

Abstract

The performance of object detection algorithms running on images taken from Unmanned Aerial Vehicles (UAVs) remains limited when compared to the object detection algorithms running on ground taken images. Due to its various features, YOLO based models, as a part of one-stage object detectors, are preferred in many UAV based applications. In this paper, we are proposing novel architectural improvements to the YO-LOv5 architecture. Our improvements include: (i) increasing the number of detection layers and (ii) use of transformers in the model. In order to train and test the performance of our proposed model, we used VisDrone and SkyData datasets in our paper. Our test results suggest that our proposed solutions can improve the detection accuracy.


İnsansız Hava Araçları (İHA) üzerindeki kameralardan alınan görüntülerde, nesne tanıma algoritmalarının başarımı, yerden çekilen görüntülerdeki performanslara göre daha sınırlı kalabilmektedir. Birçok İHA uygulamasında, tekgeçişli olmasından ve iki-geçişli yöntemlere göre daha hızlı olmasından dolayı, önceden eğitilmiş modelleri ile beraber gelen YOLOv5 algoritması kullanılmaya başlanmıştır. Ancak YOLOv5 algoritmasının İHA tabanlı imgeler üzerindeki performansı, yerden çekilen resimler üzerindeki performansına oranla düşük kalmaktadır. O nedenle bu çalışmada, YOLOv5 algoritmasının performansını arttırmak adına mimari çözümler önerilmiştir. Bu çözümler: (i) farklı sayıda tahmin yapan katman kullanmak, ve (ii) dönüştürücü (transformer) katmanı kullanmak olarak sıralanabilir. Sunulan yöntem, en güncel olan VisDrone ve Sky- DataV1 veri kümeleri üzerinde, orijinal YOLOv5 algoritması ile karşılaştırıldığında, performans artışı sağlamıştır.

Course

Other identifiers

Book Title

Citation

Collections