Unified intrinsically motivated exploration for off-policy learning in continuous action spaces
buir.contributor.author | Sağlam, Baturay | |
buir.contributor.author | Mutlu, Furkan B. | |
buir.contributor.author | Dalmaz, Onat | |
buir.contributor.author | Kozat, Süleyman S. | |
buir.contributor.orcid | Sağlam, Baturay|0000-0002-8324-5980 | |
buir.contributor.orcid | Kozat, Süleyman S.|0000-0002-6488-3848 | |
dc.citation.epage | [4] | en_US |
dc.citation.spage | [1] | en_US |
dc.contributor.author | Sağlam, Baturay | |
dc.contributor.author | Mutlu, Furkan B. | |
dc.contributor.author | Dalmaz, Onat | |
dc.contributor.author | Kozat, Süleyman S. | |
dc.coverage.spatial | Safranbolu, Turkey | en_US |
dc.date.accessioned | 2023-02-15T06:42:25Z | |
dc.date.available | 2023-02-15T06:42:25Z | |
dc.date.issued | 2022-08-29 | |
dc.department | Department of Electrical and Electronics Engineering | en_US |
dc.description | Conference Name: 2022 30th Signal Processing and Communications Applications Conference (SIU) | en_US |
dc.description | Date of Conference: 15-18 May 2022 | en_US |
dc.description.abstract | Exploration is maintained in continuous control using undirected methods, in which random noise perturbs the network parameters or selected actions. Exploration that is intrinsically driven is a good alternative to undirected techniques. However, it is only studied for discrete action domains. The intrinsic incentives in the existing reinforcement learning literature are unified together in this study by a deterministic artificial goal generation rule for off-policy learning. The agent gains additional reward through this practice if it chooses actions that lead it to useful state spaces. An extensive set of experiments indicates that the introduced artificial reward rule significantly improves the performance of the off-policy baseline algorithms. | en_US |
dc.description.abstract | Keşif, rastgele gürültünün ağ parametrelerini veya seçilen eylemleri bozduğu, yönlendirilmemiş yöntemler kullanılarak sürekli kontrolde sürdürülmektedir. İçsel olarak yönlendirilen keşif, yönlendirilmemiş tekniklere iyi bir alternatiftir ancak yalnızca ayrık eylem alanları için incelenmiştir. Mevcut pekiştirmeli öğrenme literatüründeki içsel teşvikler, bu çalışmada politika-dışı öğrenme için deterministik bir yapay hedef oluşturma kuralıyla birleştirilmiştir. Ajan, kendisini yararlı durum uzaylarına götüren eylemleri seçerse, bu uygulama aracılığıyla ek bir ödül kazanmaktadır. Kapsamlı bir deney seti, tanıtılan yapay ödül kuralının, politika-dışı temel algoritmaların performansını önemli ölçüde geliştirdiğini göstermektedir. | |
dc.description.provenance | Submitted by Betül Özen (ozen@bilkent.edu.tr) on 2023-02-15T06:42:25Z No. of bitstreams: 1 Unified_Intrinsically_Motivated_Exploration_for_Off-Policy_Learning_in_Continuous_Action_Spaces.pdf: 4393232 bytes, checksum: 82ded556eba78df067b9919de86d1c1a (MD5) | en |
dc.description.provenance | Made available in DSpace on 2023-02-15T06:42:25Z (GMT). No. of bitstreams: 1 Unified_Intrinsically_Motivated_Exploration_for_Off-Policy_Learning_in_Continuous_Action_Spaces.pdf: 4393232 bytes, checksum: 82ded556eba78df067b9919de86d1c1a (MD5) Previous issue date: 2022-08-29 | en |
dc.identifier.doi | 10.1109/SIU55565.2022.9864795 | en_US |
dc.identifier.eisbn | 978-1-6654-5092-8 | |
dc.identifier.issn | 2165-0608 | |
dc.identifier.uri | http://hdl.handle.net/11693/111288 | |
dc.language.iso | Turkish | en_US |
dc.publisher | IEEE | en_US |
dc.relation.isversionof | https://www.doi.org/10.1109/SIU55565.2022.9864795 | en_US |
dc.source.title | Signal Processing and Communications Applications Conference (SIU) | en_US |
dc.subject | Deep reinforcement learning | en_US |
dc.subject | Exploration | en_US |
dc.subject | İntrinsic motivation | en_US |
dc.subject | Continuous control | en_US |
dc.subject | Off-policy learning | en_US |
dc.subject | Derin pekiştirmeli öğrenme | en_US |
dc.subject | Keşif | en_US |
dc.subject | İçsel motivasyon | en_US |
dc.subject | Sürekli kontrol | en_US |
dc.subject | Politika-dışı öğrenme | en_US |
dc.title | Unified intrinsically motivated exploration for off-policy learning in continuous action spaces | en_US |
dc.title.alternative | Sürekli eylem alanlarında politika-dışı öğrenme için birleştirilmiş içsel motivasyonlu keşif | en_US |
dc.type | Conference Paper | en_US |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Unified_Intrinsically_Motivated_Exploration_for_Off-Policy_Learning_in_Continuous_Action_Spaces.pdf
- Size:
- 4.19 MB
- Format:
- Adobe Portable Document Format
- Description:
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.69 KB
- Format:
- Item-specific license agreed upon to submission
- Description: