The performance comparison of different training strategies for reinforcement learning on DeepRTS

buir.contributor.authorŞahin, Safa Onur
dc.citation.epage[4]en_US
dc.citation.spage[1]en_US
dc.contributor.authorŞahin, Safa Onur
dc.contributor.authorYücesoy, Veysel
dc.coverage.spatialSafranbolu, Turkeyen_US
dc.date.accessioned2023-02-13T13:25:33Z
dc.date.available2023-02-13T13:25:33Z
dc.date.issued2022-08-29
dc.departmentDepartment of Electrical and Electronics Engineeringen_US
dc.descriptionConference Name: 2022 30th Signal Processing and Communications Applications Conference (SIU)en_US
dc.descriptionDate of Conference: 15-18 May 2022en_US
dc.description.abstractIn this paper, we train reinforcement learning agents on the game of DeepRTS under different training strategies, which are i) training against rule based agents, ii) self-training and iii) training by adversarial attack to another agent. We perform certain modifications on the DeepRTS game and the reinforcement learning framework to make it closer to real life decision making problems. For this purpose, we allow agents take macro actions based on human heuristics, where these actions may last multiple time steps and the durations for these actions may differ from each other. In addition, the agents simultaneously take actions for each available unit at a time step. We train the reinforcement learning based agents under three different training strategies and we provide a detailed performance analysis of these agents against several reference agents.en_US
dc.description.abstractBu bildiride, yapay zeka tabanlı ajanların öğrenim yapması amacıyla geliştirilen DeepRTS oyunu üzerinde i) kural tabanlı ajanlara karşı eğitim, ii) kendi kopyasına karşı egitim ve iii) egitimi tamamlanmış pekiştirmeli öğrenme ajanına çekişmeli atak ile egitim olmak üzere üç farklı eğitim stratejisi kullanılarak ajanların eğitimi tamamlanmış ve bu ajanlar üzerinde ilgili performans analizleri yapılmıştır. Gerçek hayat karar alma problemlerine benzetme amacıyla eğitim yapılan ortam ve pekiştirmeli ögrenme çerçevesi üzerinde çeşitli değişikliler ˘ uygulanmıştır. Ajanların makro aksiyonlar ile karar alması sağlanmış, bu aksiyonların birden fazla zaman adımı sürebilmesine ve birbirlerinden farklı süreler alabilmesine olanak saglanmıştır. Ayrıca, herhangi bir zaman adımında birden fazla ve değişken sayıdaki üniteye komut verilebilmektedir. Ajanların üç farklı eğitim stratejisi altında eğitimleri tamamlanmış, ve çok sayıdaki referans ajana karşı performansı raporlanmıştır.
dc.description.provenanceSubmitted by Betül Özen (ozen@bilkent.edu.tr) on 2023-02-13T13:25:32Z No. of bitstreams: 1 The_Performance_Comparison_of_Different_Training_Strategies_for_Reinforcement_Learning_on_DeepRTS.pdf: 1181586 bytes, checksum: f334139d8a619c7bcff3db4d7cc12790 (MD5)en
dc.description.provenanceMade available in DSpace on 2023-02-13T13:25:33Z (GMT). No. of bitstreams: 1 The_Performance_Comparison_of_Different_Training_Strategies_for_Reinforcement_Learning_on_DeepRTS.pdf: 1181586 bytes, checksum: f334139d8a619c7bcff3db4d7cc12790 (MD5) Previous issue date: 2022-08-29en
dc.identifier.doi10.1109/SIU55565.2022.9864884en_US
dc.identifier.eisbn78-1-6654-5092-8
dc.identifier.issn2165-0608
dc.identifier.urihttp://hdl.handle.net/11693/111216
dc.language.isoTurkishen_US
dc.publisherIEEEen_US
dc.relation.isversionofhttps://www.doi.org/10.1109/SIU55565.2022.9864884en_US
dc.source.titleIEEE Signal Processing and Communications Applications (SIU)en_US
dc.subjectTrainingen_US
dc.subjectDecision makingen_US
dc.subjectReinforcement learningen_US
dc.subjectGamesen_US
dc.subjectSignal processingen_US
dc.subjectPerformance analysisen_US
dc.subjectDerin pekiştirmeli öğrenme
dc.subjectÖz eğitim
dc.subjectÇekişmeli atak ile eğitim
dc.subjectGerçek zamanlı strateji
dc.subjectEş zamanlı makro aksiyonlar
dc.titleThe performance comparison of different training strategies for reinforcement learning on DeepRTSen_US
dc.title.alternativeDeepRTS üzerinde pekiştirmeli öğrenme için farklı eğitim stratejilerinin performans karşılaştırması
dc.typeConference Paperen_US

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
The_Performance_Comparison_of_Different_Training_Strategies_for_Reinforcement_Learning_on_DeepRTS.pdf
Size:
1.13 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.69 KB
Format:
Item-specific license agreed upon to submission
Description: