Pekiştirmeli öğrenme algoritmalarının DeepRTS oyunu üzerinde performans karşılaştırması

buir.contributor.authorŞahin, Safa Onur
buir.contributor.authorYücesoy, Veysel
dc.citation.epage4en_US
dc.citation.spage1en_US
dc.contributor.authorŞahin, Safa Onur
dc.contributor.authorYücesoy, Veysel
dc.coverage.spatialIstanbul, Turkeyen_US
dc.date.accessioned2022-02-01T12:12:30Z
dc.date.available2022-02-01T12:12:30Z
dc.date.issued2021-06-11
dc.departmentDepartment of Electrical and Electronics Engineeringen_US
dc.descriptionConference Name: 2021 29th Signal Processing and Communications Applications Conference (SIU)en_US
dc.descriptionDate of Conference: 9-11 June 2021en_US
dc.description.abstractBu bildiride, i) yapay zeka ile öğrenme amaçlı geliştirilen DeepRTS oyunu için makro aksiyonların kullanıldığı bir çevre oluşturulmuş ve ii) belirli pekiştirmeli öğrenme algoritmaları, üzerlerinde gerekli değişiklikler yapılarak bu çevre üzerinde eğitimleri sağlanmış ve ilgili performans analizleri yapılmı ştır. Gerçek hayat planlamalarıyla paralellik çizme ve görece düşük donanımlarla bir gerçek zamanlı strateji oyununu oynama amacıyla DeepRTS oyunu üzerinde değişikliklere gidilmiştir. ˙Ilk olarak, bir makro aksiyon seti hazırlanmış ve ajanların yalnızca bu set içerisinden aksiyon alabilmesi sağlanmıştır. ˙Ikinci olarak, gerçek hayat planlamalarına paralel olarak sistem herhangi bir anda komut alabilecek bütün birimler için aksiyon alınabilecek duruma getirilmiştir. Bu durum makro aksiyonların farklı zaman adımları sürmesi ile birlikte ele alındığında, herhangi bir anda birden fazla aksiyonun başlayıp, birden fazla aksiyonun tamamlanmasına olanak sağladığı için klasik pekiştirmeli öğrenme probleminden bir miktar ayrılmıştır. Ayrıca, literatürde bilinen kredi atama problemine farklı bir boyut ekleyerek daha karmaşık hale getirmektedir. Ajanların eğitiminde kullanılma amacı ile ofansif, defansif ve rastgele kural tabanlı ajanlar oluşturulmuş ve pekiştirmeli öğrenme tabanlı ajanların eğitimleri sırasında dönüşümlü şekilde düşman ajan olarak kullanılmıştır. Eğitimi tamamlanan ajanların birbirlerine karşı oyuncu-1 ve oyuncu-2 olarak performansı raporlanmıştır.en_US
dc.description.abstractIn this paper, i) we build a framework using macro actions on top of DeepRTS, which is specifically developed for learning purposes, and ii) we train a number of deep reinforcement learning based agents and then we conduct a detailed performance analysis on the performance of these agents. We make changes on the publicly available version of DeepRTS to make it parallel to real life planning problems and make it trainable with a decent hardware. Firstly, we create a set of macro actions based on human heuristics and we train our agent using only these actions. Secondly, similar to the real life planning problem, we change the problem such that we simultaneously take actions for all available unit at a time step. When we consider this situation together with duration of macro actions being different, multiple actions may start and multiple actions ends at any time step. Therefore, the problem draw apart from classical reinforcement learning problem in a certain amount. In addition, the credit assignment problem becomes more sophisticated since each action lasts a duration and at any time multiple actions are conducted. We create three rule based agents to use them as enemy players in training of our agents. We report the performance of the agents as player-1 and player-2 against each others.en_US
dc.identifier.doi10.1109/SIU53274.2021.9477938en_US
dc.identifier.eisbn978-1-6654-3649-6
dc.identifier.isbn978-1-6654-3650-2
dc.identifier.issn2165-0608
dc.identifier.urihttp://hdl.handle.net/11693/76946
dc.language.isoTurkishen_US
dc.publisherIEEEen_US
dc.relation.isversionofhttps://dx.doi.org/10.1109/SIU53274.2021.9477938en_US
dc.source.titleIEEE Signal Processing and Communications Applications (SIU)en_US
dc.subjectDerin pekiştirmeli öğrenmeen_US
dc.subjectGerçek zamanlı stratejien_US
dc.subjectMakro aksiyonen_US
dc.subjectDeepRTSen_US
dc.subjectEş zamanlı aksiyonlaren_US
dc.subjectDeep reinforcement learningen_US
dc.subjectReal time strategyen_US
dc.subjectMacro actionsen_US
dc.subjectSimultaneous actionsen_US
dc.titlePekiştirmeli öğrenme algoritmalarının DeepRTS oyunu üzerinde performans karşılaştırmasıen_US
dc.title.alternativeReinforcement learning algorithms performance comparison on the game of DeepRTSen_US
dc.typeConference Paperen_US

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Reinforcement_Learning_Algorithms_Performance_Comparison_on_the_Game_of_DeepRTS.pdf
Size:
570.67 KB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.69 KB
Format:
Item-specific license agreed upon to submission
Description: