Improving experience replay architecture with K-Means clustering
buir.contributor.author | Şahin, Safa Onur | |
buir.contributor.orcid | Şahin, Safa Onur|0000-0001-8528-058X | |
dc.citation.epage | 4 | en_US |
dc.citation.spage | 1 | |
dc.contributor.author | Serbest, S. | |
dc.contributor.author | Taşbaş, A. S. | |
dc.contributor.author | Şahin, Safa Onur | |
dc.coverage.spatial | İstanbul, Türkiye | |
dc.date.accessioned | 2024-03-22T13:41:05Z | |
dc.date.available | 2024-03-22T13:41:05Z | |
dc.date.issued | 2023-08-28 | |
dc.department | Department of Electrical and Electronics Engineering | |
dc.description | Date of Conference: 05-08 July 2023 | |
dc.description | Conference Name: 31st IEEE Conference on Signal Processing and Communications Applications, SIU 2023 | |
dc.description.abstract | Replay memory highly affects the performance of deep reinforcement learning algorithms in terms of data efficiency and training time. How the experiences will be stored in the memory and sampling will be realized are subjects of ongoing research in the field. In this paper, a new replay memory module, called K-Means Replay Memory is designed. The module consists of two submodules called Recent Memory and Global Memory. New experiences are inserted only into recent memory and when the number of experiences in recent memory exceeds a certain limit, experience share occurs from recent memory to global memory. After the experience share, similarity sets are constituted via K-Means clustering algorithm within the stored experiences. While sampling, the distribution of experiences sampled from recent memory with respect to similarity sets and average losses obtained from neural networks are taken into account in order to compute set probabilities. Experiences are sampled from global memory by using these probabilities. Experiments are performed by using Prioritized Experience Replay, Uniform Experience Replay and K-Means Replay Memory, and obtained results are given in this paper. | |
dc.description.abstract | Tekrar Hafızası, derin pekiştirmeli öğrenme algoritmalarının performansını veri ihtiyacı ve eğitim süresi bakımından önemli ölçüde etkilemektedir. Tekrar hafızasında tecrübelerin nasıl bir yapıda tutulacağı ve örnekleme işleminin nasıl gerçekleştirileceği bu alanda devam eden araştırma konularından biridir. Bu bildiride, K-Means Tekrar Hafızası adı verilen bir tekrar hafızası modülü tasarlanmıştır. Güncel Hafıza ve Küresel Hafıza olarak adlandırılan iki yapıdan oluşan bu modülde, yeni tecrübeler güncel hafızaya eklenmekte ve belli bir limit aşıldığında küresel hafızaya tecrübe aktarımı gerçekleştirilmektedir. Tecrübe aktarımının hemen ardından K-Means kümeleme yöntemi ile tecrübeler arasında benzerlik kümeleri oluşturulmaktadır. Örnekleme işlemi sırasında, güncel hafızadan örneklenen tecrübelerin kümelere göre dağılımları ve kümelerin yapay sinir ağlarından elde edilen ortalama kayıp değerleri göz önüne alınarak kümelerin olasılık değerleri hesaplanmakta, küresel hafızadan örnekleme işlemi bu olasılık değerleri kullanılarak gerçekleştirilmektedir. K-Means Tekrar Hafızası, Öncelikli Tekrar Hafızası ve Eşit Olasılıklı Tekrar Hafızası kullanılarak deneyler gerçekleştirilmiş ve elde edilen sonuçlar paylaşılmıştır. | |
dc.description.provenance | Made available in DSpace on 2024-03-22T13:41:05Z (GMT). No. of bitstreams: 1 Improving_experience_replay_architecture_with_k-means_clustering.pdf: 1031043 bytes, checksum: df34c45f2632a7b62fa023cc05942dce (MD5) Previous issue date: 2023-08 | en |
dc.identifier.doi | 10.1109/SIU59756.2023.10224023 | |
dc.identifier.eisbn | 9798350343557 | |
dc.identifier.isbn | 9798350343564 | |
dc.identifier.issn | 2165-0608 | |
dc.identifier.uri | https://hdl.handle.net/11693/115096 | |
dc.language.iso | Turkish | |
dc.publisher | IEEE - Institute of Electrical and Electronics Engineers | |
dc.relation.isversionof | https://dx.doi.org/10.1109/SIU59756.2023.10224023 | |
dc.source.title | 2023 31st Signal Processing and Communications Applications Conference (SIU 2023) | |
dc.subject | Replay memory | |
dc.subject | Deep reinforcement learning | |
dc.subject | Tekrar hafızası | |
dc.subject | Derin pekiştirmeli öğrenme | |
dc.title | Improving experience replay architecture with K-Means clustering | |
dc.title.alternative | K-Means kümeleme ile tekrar hafızası mimarisinin geliştirilmesi | |
dc.type | Conference Paper |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Improving_experience_replay_architecture_with_k-means_clustering.pdf
- Size:
- 1006.88 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 2.01 KB
- Format:
- Item-specific license agreed upon to submission
- Description: