YOLODrone+: improved YOLO architecture for object detection in UAV images
Date
2022-08-29Source Title
Signal Processing and Communications Applications Conference (SIU)
Print ISSN
2165-0608
Publisher
IEEE
Pages
[1] - [4]
Language
Turkish
Type
Conference PaperItem Usage Stats
15
views
views
18
downloads
downloads
Abstract
The performance of object detection algorithms running on images taken from Unmanned Aerial Vehicles (UAVs) remains limited when compared to the object detection algorithms running on ground taken images. Due to its various features, YOLO based models, as a part of one-stage object detectors, are preferred in many UAV based applications. In this paper, we are proposing novel architectural improvements to the YO-LOv5 architecture. Our improvements include: (i) increasing the number of detection layers and (ii) use of transformers in the model. In order to train and test the performance of our proposed model, we used VisDrone and SkyData datasets in our paper. Our test results suggest that our proposed solutions can improve the detection accuracy. İnsansız Hava Araçları (İHA) üzerindeki kameralardan
alınan görüntülerde, nesne tanıma algoritmalarının
başarımı, yerden çekilen görüntülerdeki performanslara göre
daha sınırlı kalabilmektedir. Birçok İHA uygulamasında, tekgeçişli olmasından ve iki-geçişli yöntemlere göre daha hızlı
olmasından dolayı, önceden eğitilmiş modelleri ile beraber gelen
YOLOv5 algoritması kullanılmaya başlanmıştır. Ancak YOLOv5
algoritmasının İHA tabanlı imgeler üzerindeki performansı, yerden
çekilen resimler üzerindeki performansına oranla düşük
kalmaktadır. O nedenle bu çalışmada, YOLOv5 algoritmasının
performansını arttırmak adına mimari çözümler önerilmiştir. Bu
çözümler: (i) farklı sayıda tahmin yapan katman kullanmak,
ve (ii) dönüştürücü (transformer) katmanı kullanmak olarak
sıralanabilir. Sunulan yöntem, en güncel olan VisDrone ve Sky-
DataV1 veri kümeleri üzerinde, orijinal YOLOv5 algoritması ile
karşılaştırıldığında, performans artışı sağlamıştır.
Permalink
http://hdl.handle.net/11693/111266Published Version (Please cite this version)
https://www.doi.org/10.1109/SIU55565.2022.9864746Collections
- Work in Progress 376