Face inpainting with pre-trained image transformers

buir.contributor.authorGönç, Kaan
buir.contributor.authorSağlam, Baturay
buir.contributor.authorKozat, Süleyman S.
buir.contributor.authorDibeklioğlu, Hamdi
buir.contributor.orcidSağlam, Baturay|0000-0002-8324-5980
buir.contributor.orcidKozat, Süleyman S.|0000-0002-6488-3848
dc.citation.epage[4]en_US
dc.citation.spage[1]en_US
dc.contributor.authorGönç, Kaan
dc.contributor.authorSağlam, Baturay
dc.contributor.authorKozat, Süleyman S.
dc.contributor.authorDibeklioğlu, Hamdi
dc.coverage.spatialSafranbolu, Turkeyen_US
dc.date.accessioned2023-02-14T07:00:22Z
dc.date.available2023-02-14T07:00:22Z
dc.date.issued2022-08-29
dc.departmentDepartment of Computer Engineeringen_US
dc.departmentDepartment of Electrical and Electronics Engineeringen_US
dc.descriptionConference Name: 2022 30th Signal Processing and Communications Applications Conference (SIU)en_US
dc.descriptionDate of Conference: 15-18 May 2022en_US
dc.description.abstractImage inpainting is an underdetermined inverse problem that allows various contents to fill in the missing or damaged regions realistically. Convolutional neural networks (CNNs) are commonly used to create aesthetically pleasing content, yet CNNs have restricted perception fields for collecting global characteristics. Transformers enable long-range relationships to be modeled and different content generated with autoregressive modeling of pixel-sequence distributions using image-level attention mechanism. However, the current approaches to inpainting with transformers are limited to task-specific datasets and require larger-scale data. We introduce an approach to image inpainting by leveraging pre-trained vision transformers to remedy this issue. Experiments show that our approach can outperform CNN-based approaches and have a remarkable performance closer to the task-specific transformer methods.en_US
dc.description.abstractGörüntü yamalama, bir görüntüdeki çeşitli içeriklerin eksik veya hasarlı bölgelerini gerçekçi bir şekilde doldurulmasına izin veren, belirsiz bir ters problemdir. Evrişimli Sinir Ağları (ESA veya Convolutional Neural Networks) estetik açıdan hoş içerik oluşturmak için yaygın olarak kullanılmaktadır ancak ESA’lar küresel özellikleri toplamak için sınırlı algı alanlarına sahiptir. Dönüştürücüler (Transformers), uzun menzilli ilişkilerin modellenmesini ve görüntü düzeyinde dikkat (attention) mekanizması kullanılarak piksel dizisi dağılımlarının otoregresif modellemesi ile farklı içeriklerin oluşturulmasını sağlamaktadır. Bununla birlikte, Dönüştürücülerle yamalamaya yönelik mevcut yaklaşımlar, göreve özgü veri kümeleriyle sınırlıdır ve daha büyük ölçekli veriler gerektirmektedir. Bu bildiri, bahsi geçen sorunu çözmek için önceden eğitilmiş görüntü Dönüştürücülerden yararlanarak görüntü yamalamaya bir yaklaşım getirmektedir. Gerçekleştirilen deneyler, yaklaşımımızın ESA tabanlı yaklaşımlardan daha iyi performans gösterebileceğini ve göreve özel Dönüştürücü bazlı yöntemlere daha yakın ve dikkate değer bir performansa sahip oldugunu belirtmektedir.
dc.identifier.doi10.1109/SIU55565.2022.9864676en_US
dc.identifier.eisbn978-1-6654-5092-8en_US
dc.identifier.issn2165-0608en_US
dc.identifier.urihttp://hdl.handle.net/11693/111229en_US
dc.language.isoTurkishen_US
dc.publisherIEEEen_US
dc.relation.isversionofhttps://www.doi.org/10.1109/SIU55565.2022.9864676en_US
dc.source.titleSignal Processing and Communications Applications Conference (SIU)en_US
dc.subjectImage inpaintingen_US
dc.subjectTransformersen_US
dc.subjectDeep generative modelsen_US
dc.subjectGörüntü yamalama
dc.subjectDönüştürücüler
dc.subjectDerin üretken modeller
dc.titleFace inpainting with pre-trained image transformersen_US
dc.typeConference Paperen_US

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Face_Inpainting_with_Pre-trained_Image_Transformers.pdf
Size:
2.24 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.69 KB
Format:
Item-specific license agreed upon to submission
Description: